摘要:本次研究主要是对一种字符识别的方法以及装置进行研究,研究的主要目的在于提升字符图像识别的精度和准确度,研究字符识别的方法主要是对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;对所述精确字符图像进行字符识别。从而达到研究的目的。并形成字符识别装置,应用到实际工作之中。
关键词:字符识别;方法;装置;二值化
字符图像质量是影响人们当前工作的重要因素,为了使字符图像能够更加清晰、准确的识别,需要通过一定的方法和技术手段来完成字符图像识别,目前,对字符图像识别的方式和方法也比较多,主要包括结构模式识别和统计模式识别,并且当前出现的光学字符识别技术已然成为模式识别的一个重要分支,字符的识别方法也有了一定的进展,为了进一步使字符识别的清晰度和精度得到提升,本文将对一种字符识别方法及装置进行研究。
1.技术研究背景
传统的电力行业进行电力仪表设备等的电力标签(读数)识别都是通过人工进行,其识别效率低下,且对于工作人员来说在电力布置复杂的地区靠近电力仪表设备还存在安全风险。随着图像采集电子设备以及图像处理算法的迅速发展,为了减少人力成本、减少电力作业风险,许多电力设备的标签和读数需要采用拍摄设备图像,然后从图像上获取设备的标签及读数。
但是现有的基于图像识别的电力标签识别通常是对同一类型的电力设备上的读数和标签进行预设匹配规则的识别,应用到其他类型的电力设备时读数或标签的识别准确率就会大幅减低,同时传统电力标签图像识别技术的识别精度也无法满足如今的需求。
2.研究的主要内容和方法
2.1研究的内容及方法
本次研究的目的在于提供一种字符识别方法及装置,以解决上述现有技术中传统电力设备读数图像识别的适用性差、识别准确率低的问题,具体研究的内容及方法如下:
(1)本次研究实施例提供了一种字符识别方法,所述字符识别方法包括:对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;对所述精确字符图像进行字符识别。同时采用深度卷积神经网络对所述精确字符图像进行字符识别,从而获得第一识别结果。并采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果。选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
(2)本次研究实施例提供了一种字符识别装置,所述字符识别装置包括:二值化模块,用于对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;边界框精修模块,用于采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;识别模块,用于对所述精确字符图像进行字符识别。主要包括:神经网络识别单元,用于采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果;模板识别单元,用于采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果;比较单元,用于选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
(3)本次研究实施例还提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行上述内容中的步骤。
2.2具体研究方法
本次研究主要通过三个实施例来对一种字符识别方法及装置进行研究。
(1)第一实施例:如图1所示,主要是此实施例提供的一种字符识别方法流程,具体步骤如下:
步骤S10:对包含设备字符图像(如用电度数、变压器电压、电池温度等)的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像。
步骤S20:采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像。
步骤S30:对所述精确字符图像进行字符识别。首先,采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果;其次,采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果;最后,选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
图1 第一实施例图解
(2)第二实施例:为了配合此次研究第一实施例提供的所述字符识别方法,本发明第二实施例还提供了一种字符识别装置100。如图2所示,为此次研究第二实施例提供的一种字符识别装置的模块示意图。其中,字符识别装置100包括二值化模块110、边界框精修模块120和识别模块130。而二值化模块110,用于对包含设备字符图像的设备图片进行二值化处理以获得二值化图片,基于所述二值化图片的连通域特性从所述二值化图片中确定所述字符图像;边界框精修模块120,用于采用边框精修神经网络确定所述字符图像的字符边界框,以从所述字符图像中提取精确字符图像;识别模块130,用于对所述精确字符图像进行字符识别。识别模块130包括神经网络识别单元和模板识别单元。所述神经网络识别单元,用于采用深度卷积神经网络对所述精确字符图像进行字符识别,获得第一识别结果。所述模板识别单元,用于采用模板匹配算法对所述精确字符图像进行字符识别,获得第二识别结果,同时,识别模块130还包括比较单元,所述比较单元用于选取所述第一识别结果和所述第二识别结果中识别准确率较高的单个字符识别结果组合为完整的字符识别结果。
图2 第二实施例图解
(3)第三实施例:如图3所示,为此次研究第三实施例提供的一种可应用于本申请实施例中的电子设备的结构框图。本实施例提供的电子设备200可以包括字符识别装置100、存储器201、存储控制器202、处理器203、外设接口204、输入输出单元205、音频单元206、显示单元207。这些元件之间存在直接或间接地电性连接,以实现数据的传输或交互。
其中,存储器201可以是随机存取存储器(RandomAccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器201用于存储程序,所述处理器203在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服务器所执行的方法可以应用于处理器203中,或者由处理器203实现。
处理器203可以是一种集成电路芯片,具有信号的处理能力。上述的处理器203可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器203也可以是任何常规的处理器等。
所述外设接口204将各种输入/输出装置耦合至处理器203以及存储器201。在一些实施例中,外设接口204,处理器203以及存储控制器202可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元205用于提供给用户输入数据实现用户与所述服务器(或本地终端)的交互。所述输入输出单元205可以是,但不限于,鼠标和键盘等设备。
音频单元206向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元207在所述电子设备200与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元207可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器203进行计算和处理。
可以理解,图3所示的结构仅为示意,所述电子设备200还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。
图3 第三实施例图解
3.研究结果
此次研究提供了一种字符识别方法及装置,所述字符识别方法通过二值化处理和连通域特性处理先对包含设备字符图像的设备图片进行字符图像的初步确定,具备较快的处理速度;再采用边框精修神经网络从字符图像中提取精确字符图像,通过神经网络提高了边界框精修的速度和准确度,从而将需要进行字符识别的字符图像区域确定在一个更加小而精确的范围,提高了字符识别的效率和准确率。
4.结论
综上所述,本次研究实施例提供了一种字符识别方法及装置,所述字符识别方法通过二值化处理和连通域特性处理先对包含设备字符图像的设备图片进行字符图像的初步确定,具备较快的处理速度;再采用边框精修神经网络从字符图像中提取精确字符图像,通过神经网络提高了边界框精修的速度和准确度,从而将需要进行字符识别的字符图像区域确定在一个更加小而精确的范围,提高了字符识别的效率和准确率。
参考文献
[1]钟工.一种字符识别方法和装置[J].中国经济和信息化,1991(10):40-44.
[2]张秀玲.一种基于RBF神经网络的数字模式识别方法[J].仪器仪表学报,2002,23(3):265-267.
论文作者:张瑜桐、王秋菊、曹权林、罗庆兵、赵琳
论文发表刊物:《科技新时代》2018年9期
论文发表时间:2018/11/16
标签:字符论文; 所述论文; 图像论文; 精确论文; 方法论文; 处理器论文; 装置论文; 《科技新时代》2018年9期论文;