AlexNet两光照下多类别法定货币识别技术论文

AlexNet两光照下多类别法定货币识别技术

刘思洋1, 黄 坚1, 刘桂雄1, 罗文佳2

(1.华南理工大学机械与汽车工程学院,广东 广州 510640; 2.广州市银科电子有限公司,广东 广州 510663)

摘 要: 基于法定货币在不同光照下局部特征不同,该文研究一种基于AlexNet的两光照下多类别法定货币识别技术。首先,分析自然光照、紫外光照下法定货币图像特征,指出不同光照下法定货币呈现不同的面额、图案等特征;其次,分析AlexNet神经网络模型与研究面向法定货币识别的AlexNet迁移学习方法;最后,在30类别的两光照下不同币种的图像样本库上进行图像识别实验,货币图像识别准确率达到100%,准确实现区分货币币种、光照条件、面额与正反面货币图像功能。与经典货币图像识别方法相比,该法能减少人工提取图像特征的工作量,具有通用性好、准确度高的特点。

关键词: 法定货币; 图像识别; 深度学习; AlexNet

0 引 言

法定货币作为重要交易手段,其自动识别技术是货币防伪鉴别技术的应用基础。目前法定货币识别方法主要包括尺寸识别法与基于货币图像特征的识别方法[1]。尺寸识别法计算量小,但可靠性低[2]。基于货币图像特征的识别方法在提取图像特征基础上,采用识别算法实现货币图像特征识别,具备通用性与泛化能力[3],是法定货识别领域的主流方法。

(2)运料车应在摊铺机前10~30cm左右停车,同时应避免碰撞摊铺机,以防止混合料出现离析现象,若有必要可采用转运车对混合料中转。

图像识别算法主要包括货币图像经典特征提取与识别算法、货币图像机器特征提取与识别算法、货币图像深度学习特征提取与识别算法[4]。其中,货币图像经典特征提取与识别算法是根据不同货币图像间色差、荧光特征等显著区别,设计图像处理算法完成识别任务[5]。如清华大学(2017年)利用在紫外光照射下人民币正面荧光面额区域作为识别特征,运用几何结构分析和模板匹配的方法实现对6种人民币面额的识别,识别准确率达到99%以上[6]。货币图像机器特征提取与识别算法是将图像上易区分的图像特征转换为特征向量,采用k最近邻算法(k-nearest neighbor,KNN)、支持向量机(support vector machine,SVM)等机器学习算法完成特征向量运算与识别[7]。如四川大学(2012年)提出一种在复杂背景条件下的票据字符分割方法,其通过小波变换提取图像中字符区域纹理特征,基于SVM对区域进行分类,定位包含文字的图像区域,随后采用kNN算法对文字区域内的像素进行聚类划分,从而实现文字分割[8]。货币图像深度学习特征提取与识别算法以图像全域特征作为输入向量,通过多层神经网络学习与训练过程,实现图像特征自动提取与识别[9]。文献[10]采用基于BP神经网络的票据图像自动识别技术,通过BP神经网络完成票据特征自动提取,完成票据金额、传票号或交易码等识别,但浅层BP神经网络存在识别准确率不足问题;文献[11]提出一种基于深度学习钞票识别方法,采用卷积神经网络(CNN)在钞票图像数据集上训练,实现韩元、印度卢比与美元多种钞票金额准确识别。上述货币图像识别算法中,经典图像处理算法须由人工设计图像防伪特征,应用不便;机器学习算法则需经过图像特征选择、特征向量生成过程,适用于小样本货币图像识别;深度学习算法由神经网络自动实现货币图像特征提取与识别,无需人工完成复杂的特征提取任务,适合两光照下多类法定货币的识别。

本文将从不同光照下法定货币图像特征分析入手,分析AlexNet训练过程与识别机理,提出基于AlexNet的两光照下多类别法定货币识别技术与应用。

1 不同光照下法定货币图像特征分析

法定货币在不同光照下呈现不同的识别特征,是区分不同光照下法定货币图像的基础。法定货币在识别过程中光照条件主要包括自然光、紫外光。图1为百元人民币在自然光、紫外光下的图像特征。

图1 自然光、紫外光下人民币图像特征

图4为不同光照下法定货币图像特征提取过程。法定货币图像通过神经网络逐层特征提取与特征图像降维,AlexNet依次识别法定货币图像边缘、色泽特征、边缘特征局部组合构成纹理图案,纹理图案拼接构成上述待识别货币在光照下局部特征,特征组合形成待识别法定货币图像。

定义代价函数度量识别结果误差以更新AlexNet网络参数,图像代价函数为:

良渚是现今浙江余杭县的一个地名,1936年原浙江省西湖博物馆的施昕更在这一带进行考古,发现十余处遗址,随后出版了《良渚(余杭县第二区黑陶文化遗址初步报告)》。其后,又在这一带发现同一文化类型的遗址100多处,1960年,夏鼐在《长江流域考古》一文(《考古》1960年第2期)中,正式提出“良渚文化”这一概念。

2 基于AlexNet两光照下多类别法定货币识别技术

2.1 AlexNet神经网络模型分析

卷积神经网络作为高效的图像识别网络,主要由卷积层、池化层与全连接层组成[12]。卷积层的神经元节点存在于特征图像中,每个节点与上一层特征图像中的局部区域通过一系列权重的卷积核连接,通过卷积运算实现特征自动提取与特征局部连接。待识别目标的图像特征相对位置不同,池化层粗糙化每个特征位置,合并图像特征相似局部区域,减少特征向量维度,增加移动或扭曲不变性。全连接层是相邻两个特征图象中,每个输入神经元均与所有输出神经元完全连接,将图像特征矩阵转换为列向量,与识别结果的类别数目相匹配。

AlexNet的输入图像分辨率为227×227,为3通道RGB图像,图像经过不同层级的卷积层与池化层作用,特征图像尺寸逐层递减,随后由全连接层神经元运算,将提取的图像特征转换为4096×1维度的特征列向量,最后经SoftMax分类层完成1 000类别物体识别。图3为AlexNet网络堆叠方式及其对应特征图像维度变化情况。

图2 AlexNet神经网络模型结构

对大型图像识别数据集ImageNet上训练并优化的卷积神经网络模型——AlexNet神经网络进行分析[13]。图2为AlexNet卷积神经网络模型图,它由11层神经网络组成,包含5层卷积层、3层池化层与3层全连接层。卷积层与池化层相互交叉堆叠,由非线性激活函数完成非线性运算,再与全连接层相连,通过反向传播算法训练所有卷积核权重参数,得到AlexNet卷积神经网络。

图3 特征图像维度变化情况

2.2 面向法定货币识别的AlexNet迁移学习

迁移学习(transfer learning)将在某一数据集上训练完成的模型参数迁移到新任务中辅助新模型训练[14]。在图像识别任务中,大部分数据或任务存在相关性,如物体边缘、纹理等特征高度一致,通过迁移学习可将已学到模型参数通过某种方式来分享给新模型,从而加快并优化模型的学习效率。面向法定货币识别任务中使用迁移学习,要对神经网络结构进行微调以实现适应新任务的网络模型训练。具体是修改AlexNet全连接层神经元个数,与法定货币识别任务类别数对应,使微调后AlexNet输出为法定货币类别。

可以发现,不同光照下货币图像特征区别明显。从图像全局特征看,不同光照下图像整体色泽、饱和度与亮度差别很大;从图像局域特征看,不同光照下货币图像具有不同的图案、面额数字与其他特征,并且局域特征在整体图像上的位置、局域特征的颜色与边缘等均有显著区别。

设法定货币图像样本集包括共计m 个法定货币图像样本为第i 个样本对应法定货币类别标签,则对单个图像设AlexNet第l 层对应网络参数为wl 、bl ,第l 层的非线性激活函数为fl ,则前向传播过程中第l 层特征提取结果与输出层预测识别结果分别为:

面向法定货币识别的AlexNet网络训练过程包括特征提取的前向传播过程、网络权重更新的反向传播过程。

为准确、快速了解当地违法猎捕情况,积极与当地乡镇政府、边防派出所协调、沟通,在共同努力下,实现了综合部署、联合巡逻、定点蹲守多措并举,为执法行动提供了有力保障。执法人员不畏山路艰险,经常在凌晨2点到重要林区进行蹲点守候,并不定时到宾馆、饭店、市场、码头等开展突击检查,确保无漏网之鱼。

图4 不同光照下法定货币图像特征提取过程

分析不同光照下法定货币图像特征的区别可知,采用深度学习识别算法识别时,通过制作不同光照下法定货币图像数据集训练识别器,由神经网络自动提取局域图像的边缘、位置与颜色特征信息,直至全域图像的色泽、饱和度与亮度特征信息,完成特征提取与识别过程,减少人工提取图像特征的工作量。

求得最优识别效果,需更新AlexNet网络参数,以最小化代价函数,网络学习率网络参数更新策略表达式为:

采用批量梯度下降法更新AlexNet网络权重,以全体样本作为对象,正则化项为减小网络权重变化幅度,防止训练过程过拟合,整体代价函数为:

山特维克可乐满隶属于山特维克集团旗下山特维克机械加工事业部门,是世界领先的金属切削刀具供应商,同时也是刀具解决方案和专业加工知识的提供者。通过在研发中的大量投资,山特维克可乐满不断开发出独特的创新产品,并与客户一起制定出一个个新的生产效率标准。山特维克可乐满在全球共有8 000名员工,业务遍及全球130个国家,客户群覆盖了全世界汽车、航空航天和能源等行业的各大制造企业。

式(1)~式(4)即为AlexNet神经网络特征提取的前向传播、网络参数更新的反向传播一次迭代过程,重复上述迭代过程直至整体代价函数收敛,面向法定货币识别任务的AlexNet网络参数更新迭代完成。

3 试验研究

按表1部件搭建法定货币图像采集装置。在紫外光照(UL)与自然光(NL)照条件下,采集两种光照条件下2005年版人民币(CN)1套、克罗地亚外币(HR)1套货币正反两面共30种法定货币图像。在MATLAB R2017b软件环境下针对法定货币图像样本库进行AlexNet网络训练。

图5为训练过程中,在训练集与验证集上法定货币图像识别准确率与整体代价函数收敛变化过程。可以看出,在学习率α=0.000 1,经100次网络迭代更新过程,AlexNet在测试集与验证集上对30类别法定货币图像识别准确率均达到100%,整体代价函数趋于网络参数空间的全局最优解。图6为AlexNet对30类别法定货币图像的部分识别结果,与经典图像处理算法、机器学习算法相比,实现区分货币币种(CN/HR)、光照条件(NL/UL)、面额与正反面货币图像功能,减少人工提取图像特征工作量。

岸坡洞式溢洪道设置属常规技术,设计通常采用掺气减蚀,合理选择泄槽过流底坡体型,加强混凝土结构强度与抗冲耐磨性能,有针对性的消能工设计等措施,以保证工程泄洪安全运用。同类工程安全鉴定中的隐患类型包括:受泄洪消能和雾化影响,出口段山体边坡可能失稳;过流面平整度控制不到位,溢洪洞抗冲蚀和抗空蚀能力差而导致局部破损(多已整改);高速水流区混凝土抗冲耐久性与设计强度偏低;常遇泄洪情况下对下部坡体保护措施重视不够等。

新课程改革倡导以学生为主体,但并不抹杀教师的作用,教师的示范和引导能有效增强学生学习的有效性。例如,进行品诗品人,走近“诗圣”—杜甫诗歌鉴赏专题的教学设计时,就如何理解“诗圣”这一称谓的内涵,教师首先示范分析了《登高》。

4 结束语

本文从自然光照与紫外光照下人民币图像局部特征分析入手,指出不同光照下法定货币图像具有不同的面额与图案等特征,可采用深度学习方法识别两光照下多类别法定货币图像;分析AlexNet网络架构与模型,研究面向法定货币图像识别任务的AlexNet迁移学习方法,微调AlexNet网络模型以满足法定货币图像识别的特定任务要求;建立面向法定货币图像识别任务的AlexNet神经网络训练过程数学模型,并应用该训练方法在自然光照与紫外光找条件下中外两套货币共30类别货币图像样本库上进行深度学习,达到100%货币图像识别准确率,并能区分货币币种、光照条件、面额与正反面图像,有效减少人工提取图像特征的工作量。

表1 法定货币图像采集装置

图5 AlexNet训练过程主要评价指标变化

图6 基于AlexNet的两光照下多类别法定货币图像部分识别结果

参考文献

[1]宋晓宁, 刘梓, 於东军, 等.表格型票据图像手写体特殊符号的混合检测算法[J].南京理工大学学报(自然科学版),2012, 36(6): 909-914.

[2]HASANUZZAMAN F M, YANG X, TIAN Y L.Robust and effective component-based banknote recognition for the blind[J].IEEE Transactions on Systems Man & Cybernetics Part C, 2012, 42(6): 1021-1030.

[3]YONG K S, DANH P T, RYOUNG P K, et al.Recognition of banknote fitness based on a fuzzy system using visible light reflection and near-infrared light transmission images[J].Sensors, 2016, 16(6): 863.

[4]罗帅, 娄震.基于印刷年份的人民币版本识别技术研究[J].现代电子技术, 2015, 38(18): 72-74.

[5]金长江, 师廷伟.红外弱小目标检测背景抑制算法研究[J].中国测试, 2016, 42(4): 115-119.

[6]李雪梨, 索双富, 武佩君.一种基于紫外荧光图像的人民币面额识别算法[J].机械设计与制造, 2017(3): 1-3.

[7]郭雪梅, 刘桂雄.多颜色模型分割自学习k-NN设备状态识别方法[J].中国测试, 2016, 42(4): 107-110.

[8]叶龙欢, 王俊峰, 高琳, 等.复杂背景下的票据字符分割方法[J].计算机应用, 2012, 32(11): 3198-3200.

[9]SOSA-GARCÍA J, ODONE F.Banknote recognition as a CBIR problem [C]// International Conference on Similarity Search and Applications.Springer, 2015.

[10]韩梦迪, 曹玉东, 杜刚.基于BP神经网络的银行票据识别[J].信息通信, 2016(9): 157-159.

[11]PHAM T D, NGUYEN D T, KIM W, et al.Deep learningbased banknote fitness classification using the reflection images by a visible-light one-dimensional line image sensor[J].Sensors, 2018, 18(2): 472.

[12]卢宏涛, 张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理, 2016, 31(1): 1-17.

[13]KRIZHEVSKY A, SUTSKEVER I, HINTON G E.ImageNet classification with deep convolutional neural networks [C]//International Conference on Neural Information Processing Systems.2012: 1097-1105.

[14]LONG M S, WANG J M, DING G G, et al.Transfer feature learning with joint distribution adaptation [C]// IEEE International Conference on Computer Vision.IEEE, 2014:2200-2207.

Technology of multi-category legal currency identification under multi-light conditions based on AlexNet

LIU Siyang1, HUANG Jian1, LIU Guixiong1, LUO Wenjia2
(1.School of Mechanical and Automotive Engineering, South China University of Technology, Guangzhou 510640,China; 2.Guangzhou Yin Ke Electronics Co., Ltd., Guangzhou 510663, China)

Abstract: Based on the difference of local characteristics of legal currency under different illuminations, this paper studies a multi-category legal currency recognition technology based on AlexNet.Firstly, the characteristics of legal currency images under natural light and ultraviolet light are analyzed.It is pointed out that the legal currency presents different fetures and patterns under different illuminations.Secondly, the AlexNet neural network model and the AlexNet migration learning method for legal currency identification are analyzed.Finally, On the image sample library of different currencies under 30 kinds of illumination, the image recognition experiment is carried out, and the accuracy of currency image recognition reaches 100%, which accurately realizes the functions of distinguishing the kinds of currency, lighting conditions, denomination and front and back currency images.Compared with the currency image recognition method, the workload of manually extracting image features can be reduced, and the utility model has the advantages of good versatility and high accuracy.

Keywords: legal currency; image identification; deep learning; AlexNet

中图分类号: TP391.4

文献标志码: A

文章编号: 1674-5124(2019)09-0118-05

doi: 10.11857/j.issn.1674-5124.2018080085

收稿日期: 2018-08-22;

收到修改稿日期: 2018-09-29

基金项目: 广州市科技计划项目(2018020300006)

作者简介: 刘思洋(1995-),男,广东揭阳市人,硕士研究生,专业方向为精密检测与仪器仪表。

通信作者: 刘桂雄(1968-),男,广东揭阳市人,教授,博导,主要从事测控技术及仪器研究。

(编辑:李刚)

标签:;  ;  ;  ;  ;  ;  

AlexNet两光照下多类别法定货币识别技术论文
下载Doc文档

猜你喜欢