基于HALCON的快递地址信息识别研究
曾志鸿 刘 军
(佛山科学技术学院机电工程学院,广东佛山528000)
摘 要: 针对物流公司利用人工分拣快递效率低下的问题,提出了基于机器视觉技术的识别快递地址的方法。该方法主要通过机器视觉软件HALCON实现,阐述了HALCON形态学分析和分析处理图像、特征提取的具体过程,最后训练一个用于识别快递信息地址的分类器。研究表明,该方法能快速准确地识别出快递包裹的地址信息,具有更高的分拣准确度和稳定性,实现了预期目标。
关键词: 机器视觉;光学字符识别;HALCON;快递地址
0 引言
随着互联网电商平台的快速发展,网上购物过程中产生了大量快递包裹,在快递配送的各个环节,目前仅少数大型分拣中心利用条形码扫描实现自动分拣[1]。在一些区域性的分拣中心,工作人员需要分拣不同区域的快递,目前主要依赖人工手动分拣,而人会产生疲劳,容易发生误操作。针对物流分拣中心人工分拣快递效率低的问题,本文提出了基于HALCON的快递地址信息识别技术。首先通过工业相机获取快递面单照片并对图像进行增强处理,然后利用仿射变换将图片旋转至水平位置,选择感兴趣区域,经过字符分割和训练分类器等步骤,识别出快递地址信息。
1 鼻胃管与胃造口 鼻胃管为最常用的给药途径,其对上消化道功能正常而不能主动经口进食或是进食不足的患者效果显著,如口咽部疾病、食管穿孔、神经性吞咽障碍、昏迷患者等[12]。
HALCON是德国MVtec公司开发的机器视觉算法包,HALCON的构架较为灵活并且鲁棒性较好,便于图像分析应用的快速开发。HALCON的鲁棒性体现在工业上的广泛接受度,在欧洲以及日本工业界已经是公认的具有最佳效能的Machine Vision软件。HALCON软件中的Hdevelop是能够与用户交互的集程序、分析、设计和编程于一体的开发环境,主要包括了图像窗口、变量窗口、算子窗口和程序编辑器窗口。图像处理完成后可以导出C++等类型的程序,有助于在Visual Studio等相关软件整合程序。
1 图像处理技术
快递地址信息识别的流程如图1所示。
1)加强农村公共服务供给的理论研究。中国学者对农村公共服务供给的研究主要是针对实践中存在的问题及相应对策的探讨,基础理论方面研究显得不足。为此,应加强相关理论的研究。
图1 快递地址信息识别流程图
1.1 读取图像
(5)取少量溶液于试管中,加入过量Ba(NO3)2溶液,静置,取上层清液,滴加稀硝酸酸化,再加入AgNO3溶液,产生白色沉淀,则说明溶液中有Cl-
1.2 图像预处理
图2 原始图像
由于现实环境较为复杂,采集的图像效果比较差,因此需要对图像进行预处理。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性,最大限度地简化数据,从而改进特征提取、图像分割、匹配和识别的可靠性。
日本非常重视科技资源的共享,制定了严格的政策和法律法规以保障科技资源的开放共享,例如《促进特定尖端大型研究设施共享的相关法律》。大型科学仪器设备作为科研进步的重要物质条件,日本建立了共享研究机构和科学仪器共享网站,例如研究设施共用综合指引网站、尖端仪器共用创新平台等,仪器设备的信息会及时发布在这些共享平台上,主要包括仪器设备的简介、使用方法、预约方式等,以方便需求者进行选择和使用。
随着社会的发展,图书馆的服务模式发生了根本性的变化,过去坐等读者上门的服务已经不能适应当前社会的需求,走出图书馆,联系读者,了解并解决读者的需求,即变被动服务为主动服务。嵌入式服务成为一种重要的服务方式,并为大家所欢迎。所谓嵌入式服务就是主动融入读者或用户的学习、研究中,在互动中提供及时有效的服务[3]。以嵌入教学和嵌入科研服务为主,针对教学中课程设置及进度,组织与学科相关的原始信息以及相关的参考资料等主动提供给教师和学生;至于科学研究的嵌入式服务,则是对科研从选题、立项、课题进展、成果鉴定和成果转化进行全程服务,收集课题相关问题的起源、发展过程、研究方法、出现的问题等,供研究者参考。
1.2.2 图像增强
HALCON软件包提供两种获取图像的方式,分别是从图像采集设备获取图像和读取本地已采集的图像。从图像采集设备获取图像可以通过HALCON提供的图像采集助手Image Acquisition自动检测相机,或者调用grab_image算子实时采集图像。而通过算子read_image可以获取本地图像,HALCON支持BMP、PNG、JPEG等多种格式的图像格式[2]。本研究采用了算子read_image读取已采集好的图像,如图2所示,图像名称为express.jpg。读取本地图像的具体代码为read_image(Image,'G:express.jpg')。
灰度图像是从RGB图像转换而来,图像增强使识别目标和背景图像区分更加明显。图像增强的算法是,图像中的每一个像素点乘以一个增强因子,加上一个抵消值(offset),增强图像每一点的像素值的算法如公式(2)所示。调用算子scale_image可以对图像进行增强处理,具体的代码为scale_image(GrayImage,ImageScaled,1.847 83,-185)。增强效果如图3所示。
1.3 仿射变换
1998年Coonrad等[14]根据对脊柱正位全长X线片上顶椎的具体位置及数目、侧弯之间的柔韧性差异分析了2000例特发性脊柱侧凸,分为21类,虽然分型比King分型丰富了,提供了足够的数据库,但也只是从脊柱侧凸的冠状面进行了考虑,并且针对各型没有具体的手术方法和合适融合范围。
gen_rectangle2(ROI_0,1 411.48,1 853.52,rad(61.398 2),700.618,114.888)
图3 增强图像
根据多层感知器的原理,本实验创建了一个字符识别分类器来识别字符。由于HALCON没有自带的中文字符库,因此首先需要生成一个训练文件。训练的主要步骤是选出训练的字符图像,生成训练文件,然后开始训练神经网络[9]。通过for循环将一个个字符图像和相对应的字符添加至训练文件,最终形成后缀为omc的字符库文件。训练代码如下:
彩色图像每个像素的颜色由Red、Green和Blue 3个分量决定,每个分量有256种取值,如果直接进行处理,信息计算量很大,因此对图像进行灰度化处理可减少图像处理时间[3]。灰度图像根据公式(1)所得,Red、Green和Blue分别表示红、绿、蓝3个通道,调用HALCON的算子rgb1_to_gray即可将彩色图像转换为灰度图像。
1.2.1 转为灰度图像
affine_trans_image(ImageReduced,ImageAffinTrans,Hom-Mat2D,'constant','false')
仿射变换效果如图4所示。
图4 旋转后图像
1.3.1 选取感兴趣区域
总之,《农家致富顾问》带我们走上了致富路,确实是一份可读性和实用性较强的农技科普读物,是广大基层干部和农民朋友的良师益友,生活向导。我们大家不能没有她——《农家致富顾问》!
感兴趣区域ROI(Region of Interest)是一个图像的点集。由于只对快递面单中的地址信息进行识别,选取感兴趣区域可减少图像处理时间,提高运行效率[5]。代码详情如下:
仿射变换属于投影变换,只对图像几何形状的层面进行变换,不影响图像的灰度值,目的是将原始图像变换到定义的标准位置,以便进行识别工作[4]。首先调用算子gen_rectangle2获取一个旋转矩形,然后通过算子vector_angle_to_rigid计算出旋转矩阵HomMat2D,旋转矩阵HomMat2D根据公式(3)获得,最后通过仿射变换实现将图像旋转至水平位置,代码详情为:
gen_rectangle1(ROI_1,1297.39,1145.85,1518.34,2515.87)
reduce_domain(ImageAffinTrans,ROI_1,ImageReduced1)
孙岩国举例,在门诊大厅扫描支付二维码,输入姓名、电话号码和身份证号,选择诊室,页面将迅速弹出挂号成功信息。就诊后,医嘱的化验采血信息及时“导航”,显示相关科室地点及距离。医生开药次日早晨,提醒服药的信息已发送至患者手机,“想忘记吃药都难”。整个过程,省却了排队挂号、交费的烦恼,也不再受找不到诊室而困扰。“最重要的是开通了住院预交金,一日清单、体验登记和报告书等移动支付项目,医保的二次结算也可顺利实现。”
选取感兴趣区域效果如图5所示。
1.3.2 图像分割
针对光照不均匀导致图像各区域亮度不同的情况,利用动态阈值分割法对图像进行分割[6]。图像分割将图像分成几个独特的区域,目前图像分割的主要方法有阈值分割、区域分割和边缘分割等[7]。此处采用阈值分割,阈值分割法是一种基于区域的图像分割技术,原理是把图像像素点分为若干类,它特别适用于目标和背景占据不同灰度级的图像。设原始图像的灰度为f(x,y),通过其灰度直方图得到一个灰度阈值t,应用公式为:
图5 ROI图像
可得到一个分割后的二值化图像。阈值分割使用的算子是threshold。具体代码为threshold(ImageReduced,Regions,0,168);此处选取的是阈值范围是0~168的区域。其灰度直方图如图6所示,横坐标表示灰度值,纵坐标表示各个灰度值的像素在图像中出现的频率。
为了验证图像分割后的每一个字符都是连通的,并且字符之间是分离的,需要调用connnection算子来确认,主要代码是connection(Regions,ConnectedRegions)。如图7所示,可以发现字符“东”和“区”不是连通区域,需要经过适当的膨胀和闭运算将未连通的字符形成一个连通区域。
1.3.3 图像形态学处理
首先通过特征选择过滤掉一部分毛刺,通过观察图像的字符特征得出,有些字符的笔画之间存在不连续的情况,如果直接进行识别将会出现不完整的字体,为使得每个字符都成为连通域,需要对图像作进一步处理[8]。可以通过以圆为结构元素进行闭运算,最后通过connection算子将单个字符连通起来,发现全部字符已经形成一个单连通区域,如图8所示。
2 学习训练
vector_angle_to_rigid(center_row,center_column,phi,center_row,center_column,rad(0),HomMat2D)
图6 灰度直方图
图7 分割图像
图8 连通图
for i:=1 to Number by 1
select_obj(SortedRegions,singeleword,i)
append_ocr_trainf(singeleword,ImageReduced1,words[i-1],'train_ocr')
endfor
从‘索邦’中筛选出肌动蛋白基因Actin和网格蛋白基因Clathrin,分别作为qRT-PCR测定基因相对表达量的内参基因。以花被片各样品的 cDNA 为模板,利用Primer 3软件设计荧光定量引物(表1)。根据SYBR© Premix Ex Taq TM Ⅱ(TaKaRa)试剂盒说明书,使用CFX Connect Real-Time PCR System(Bio-Rad)进行扩增,反应体系为20 μL,扩增程序为:95℃变性30 s,60℃退火和延伸 30 s,共39个循环,95℃变性5 s,60℃退火和延伸30 s。每份样品重复3次。
3 字符识别
OCR字符识别技术是一个系统的技术集,它的实质是根据字符所提取的特征,与系统中的模板相对比,将置信度最大的值返回,以此达到识别的目的[10]。在识别阶段,首先要用算子sort_region对字符进行排序,然后通过算子read_ocr_class_mlp载入已经训练好的字符库word.omc,最后通过多层感知神经网络对字符进行识别。具体的代码为:
do_ocr_multi_class_mlp(SortedRegions,ImageReduced,OCRHandle,Class,Confidence)
至此,已完成对地址信息的识别,识别结果显示在图像窗口,如图9所示,每个字符的识别置信度如表1所示。
图9 识别效果图
表1 识别结果置信表
4 结语
通过以上实验可以得出,用机器视觉的方法能够有效识别快递地址信息,具有准确率高和稳定性强等优点。本实验的基础是电子打印的快递面单,同时识别电子打印和手写体的快递面单可以作为本文的改进方向。
[参考文献]
[1]朱贺.基于机器视觉的快递单地址自动识别研究[D].长春:长春理工大学,2018.
[2]高永勋,任德均,严扎杰,等.基于HALCON的汽车牌照识别研究[J].精密制造与自动化,2018(4):48-50.
[3]汪成龙,黄余凤,陈铭泉,等.基于halcon的字符缺陷检测系统[J].制造业自动化,2018,40(9):38-41.
[4]李文雪.导线环形码自动识别技术研究[D].廊坊:北华航天工业学院,2019.
[5]张有,陈晓荣.基于HALCON的发票号字符识别研究[J].电子测量技术,2017,40(6):126-131.
[6]王文平.基于Halcon的芯片字符识别[D].大连:大连交通大学,2018.
[7]YANG Z,BAI J.Vial bottle mouth defect detection based onmachinevision[C]//Internationalconferenceon information and automation,2015.
[8]SUN J,MA Y Z,YANG H,et al.Character recognition method for Low-Contrast images of numerical instruments[C]//2018 IEEE 3rd International Conference on Image,Vision and Computing(ICIVC),2018.
[9]LUO H L,YU L,XIE X B,et al.Realization of vehicle license plate character recognition based on HALCON[C]//20114thInternationalCongressonImageand Signal Processing,2011.
[10]郭勇,吴乐南.行驶车辆的牌照识别系统[J].电子工程师,2000(11):37-41.
收稿日期: 2019-05-20
作者简介 :
曾志鸿(1994—),男,广东人,硕士研究生,研究方向:机器视觉。
在国民经济快速发展的同时,也想要促进了建筑行业的发展。因此,建筑行业既可以满足人们对于办公居住环境的要求,还能够促进社会经济发展。现阶段,随着建筑行业市场竞争日益激烈,也相应增加了房地产开发商所面对的安全风险,出现了一系列发展问题。所以基于价值工程分析方法深入探索工程项目管理的各项内容,希望可以提升建筑企业的经济效益。
刘军(1967—),男,江西人,硕士,副教授,研究方向:机电一体化。
标签:机器视觉论文; 光学字符识别论文; HALCON论文; 快递地址论文; 佛山科学技术学院机电工程学院论文;