中国电信股份有限公司衢州分公司 浙江龙游 324000
一、项目的研究目的及意义
1.申请项目的必要性、目的及意义
自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向。研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程。因此,研究模式识别,是理解人类智能的本质的重要途径。手写数字识别是一个传统和典型的模式识别问题。
随着信息时代的到来,人们对于信息处理的要求更加严格,不仅要有非常高的准确率,还要有非常快的处理速度。研究手写体数字识别技术,将对于今后的信息发展有着重要的作用,在光学字符识别领域中,手写字符识别是一个非常重要的分支,在现实生活中有着广泛的应用。例如在银行票据识别中,根据手写体进行识别数字;在邮件分拣过程中,根据邮编进行识别实现自动分拣,省事又省力。此外,手写字符识别对于汉字识别、人脸识别等相关领域内的其他模式识别的发展,也有很大的推动作用。特别是随着科技的进步,现如今智能手机、平板电脑等电子设备的应用更是非常普及,越来越多的人习惯于使用手写汉字或数字,因此,研究手写体数字识别技术,不仅有着重要的理论学术意义,同时还有很广泛的现实应用价值。
但是这些识别方式大都依赖于pc机,对此我们在现有资料的基础上,准备在一个更易携带的beaglebone black板子上实现这个手写数字识别的功能。该项目基于bbb板子上,在linux环境下运行的,只需要熟悉一些基础的linux操作命令,就可以在任一一台与之连接的pc机上直接进行对手写体数字的识别。
2、项目的背景、主要内容、技术水平及应用范围
1)项目背景
我国对手写体数字识别系统的研究开始于七十年代,最开始是在邮局的信件自动分拣系统中进行使用并获得成功。随后中国第一台数字字符识别机器被制作出来,它是由复旦大学所研制,该机器可以成功识别出打字机所打印出来的数字字符。与此同时,中国科学院也成功研制出邮政编码识别样机,这也是我国第一台针对于邮政编码进行识别的机器。到了八十年代,国内多所高校,像清华大学、北京大学等开始对字符识别技术进行研究,通过多年的努力研究与探索,在数字识别领域取得了很多新的突破,随着研究的深入,在手写体数字识别上也已经硕果累累。
2)主要内容
虽然国内的字符识别技术近年来发展迅速,但大多是基于 PC-Windows 平台,Linux 下开源的手写体识别软件成熟的不多,开源的更少。本项目以beagleboneblack 为硬件核心,开源的 Linux为软件核心,在此系统基础上研究实现手写体数字识别功能的可能途径。在进行复杂算法的应用开发时有重要的借鉴意义。
3)技术水平
本次项目主要是以opencv下的knn识别算法为主,识别工作分为三大步骤:预处理,特征提取,分类识别。预处理过程主要找到图像的ROI部分子图像并进行大小的归一化处理,特征提取将图像转化为特征向量,分类识别采用k-近邻分类方法进行分类处理,最后根据分类结果完成识别工作。
软件整体架构图:
用到的识别算法是k-近邻分类方法,先对需要识别的图像进行一次预处理,找到ROI(目标)区域,然后把找的的目标区域边框进行大小归一化处理,这个步骤减少了大量的无效信息量,之后就可以直接用大小归一化处理后的图片作为向量矩阵输入,然后进入识别环节,识别方法采用knn近邻分类法。这个算法首先贮藏所有的训练样本,然后通过分析(包括选举,计算加权和等方式)一个新样本周围K个最近邻以给出该样本的相应值。这种方法有时候被称作“基于样本的学习”,即为了预测,我们对于给定的输入搜索最近的已知其相应的特征向量。
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。
3、实施该项目所具备的基础、优势和风险
基础:项目成员由电子信息科学技术专业的学生组成,由电科专业马汉杰老师指导开发。本项目成员各有特长,擅长Java,C/C++等开发语言,同时能熟练使用Linux命令行进行编译开发,可以很好的进行模块化开发和整合。还有手写体数字的识别经过长期的发展,已经比较成熟,可以有丰富的资料供我们查询。
优势:学院的实验室可以提供软件、硬件支持。另,本项目指导老师马汉杰老师曾获国家科技进步奖二等奖、参与国家863、国家自然基金重大专项、浙江省重大科技攻关等项目,并与华为、中兴、TI、Radvision等国内外众多著名企业进行合作研发,对视频编码和网络服务器架构有深入的研究。
风险:本项目有可能因过于庞大而项目组成员的知识经验有限,在整合中可能出现问题无法解决而不得不舍弃部分功能。
4、项目计划目标
(1)了解目前手写体数字识别的现状,对整体项目初步评价
(2)明确整个开发流程,合理人员分工,搜集资料
(3)经过学习,掌握相应的开发知识
(4)初步实现基于bbb板子的手写体数字识别
(5)提高测试识别的准确率
(6)测试系统,对系统进行优化
(7)完整系统,整理资料,撰写论文
5.项目的后期改进部分
再这个项目成功跑起来之后,我们发现了一些需要继续改进的地方,最明显的问题是,这个手写体数字识别系统测试集的识别率并不是很高,只达到了92.4%,于是我们又寻找了另一种识别算法来对此进行改进,它就是tiny_dnn,一个用卷积神经网络来进行识别的手写体数字识别项目。
DNN是指深度神经网络。与RNN循环神经网络、CNN卷积神经网络的区别就是DNN特指全连接的神经元结构,并不包含卷积单元或是时间上的关联。神经网络技术起源于上世纪五、六十年代,当时叫感知机(perceptron),拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。
在了解到这个dnn之后,我们尝试在虚拟机的linux环境下运行,并最终成功跑了起来,
最后发现dnn的识别率达到了98.8%
二、预期成果、知识产权形成及经济、社会效益分析
1、项目的预期成果及知识产权归属情况
项目的预期成果为实现一个基于beaglebone black开发板的手写体数字识别系统,并且可以通过加大测试库的图片来逐渐提高识别精度,预期能够申请1-2个软著著作权和1-2篇论文。本项目知识产权归浙江理工大学所有。
2、项目的市场前景分析
随着电子技术的进步,芯片的处理能力也越来越强,传统的用简单的按键进行人机交互的方法显得滞后。手写输入信息因为其占用硬件空间小,符合使用者的习惯而越来越受到重视,对手写数字识别进行研究具有较强的现实意义。
3、项目的盈利能力分析及财务预算
盈利能力分析:
财务预算:
4、项目的社会效益分析
三、项目实施进度方案
2017.5.4-2017.5.24
分析项目需求,分配成员任务,查阅资料,自主学习,掌握开发模块的流程
初步接触了bb-black开发板,跑了一个流水灯程序。
2017.5.24-2017.5.31
准备在开发板上安装opencv
并设置bb-black开发板网络
2017.5.31-2017.6.7
设置nfs网络共享文件
2017.6.7-2017.6.13
成功移植opencv
2017.9.14-2017.9.21
在windows环境下vs中建立一个数字识别的工程
2017.9.22-2017.10.4
把vs下的数字识别工程,成功移植到了bb-black板子上
2017.10.5-2017.10.11
发现用knn来进行手写体数字识别,识别率不高,寻找更高识别率的算法
2017.10.11-10.26
找到了tiny_dnn项目,并在虚拟机上成功运行
2017.10.27-11.16
由于bb-black板子资源有限,无法直接编译tiny_dnn项目,尝试使用交叉编译来解决
2017.11.17-11.23
进行文档编写整理和论文投稿
作者简介:黄小明,1976年6月7日,男,汉族,浙江龙游,中国电信股份有限公司衢州分公司,部门经理,工程师,研究方向(信息处理,大数据平台建设)
论文作者:黄小明
论文发表刊物:《防护工程》2019年8期
论文发表时间:2019/7/31
标签:手写体论文; 项目论文; 数字论文; 样本论文; 算法论文; 方法论文; 板子论文; 《防护工程》2019年8期论文;