基于CNN模型的装甲目标的提取与实现
阮轶磊,张雷,李刚
(陆军装甲兵学院兵器与控制系,北京 100072)
摘 要:基于卷积理论,从无人机拍摄视频、图片中提取装甲车辆目标,为指挥员决策提供依据。主要研究卷积模型的训练策略与过程,包括训练样本的选择、组织与预处理、卷积模型的改进与超参数设置,防止过拟合采取的策略,有效提高模型对装甲图片的识别效果。
关键词:卷积网络CNN;卷积理论;装甲车辆目标;训练样本
1 引言
随着部署于战场的传感器数量增加,指挥官们能轻易获得巨量的视频、图片数据,但对数据的分析、处理、应用依然缺乏有效手段。如何快速高效地在这些数据中找到感兴趣的目标并施以打击,对战争胜负将会有至关重要的影响。人工智能技术的快速发展,给目标筛选辨别带来了更为优化的选择。以察打一体无人机为例,如果机器能依据目标的图像特征、红外特征等自动做出判断,并主动发起攻击,其效率与毁伤效果将会成倍增长,真正做到发现即摧毁,战争模式将会发生根本改变。本课题力图以前沿的深度学习技术实现对视频图片中装甲目标的检测,努力将最有可能的作战对象呈现在指挥员面前,帮助他们删除干扰信息,抓住战机。指挥员一旦确定目标,就可以根据图片拍摄信息倒溯出目标出现的位置与时间,并由此推断出敌方行动计划,做出更为合适的应对(打击或回避)。
2 卷积网络CNN
卷积神经网络(CNN)是一种为了计算二维输入数据而经过特别设计的多层人工神经网络。网络中的每个层面都由多个二维面构成,而且每个平面之间互相由多个独立的神经元组成。CNN广泛应用于计算机视觉问题的处理上,采用多层卷积网络实现装甲图片分类的测试过程如图1所示。
图1 多层卷积网络图片分类示意图
一个典型的卷积网络分类器由多种不同功能层叠加而成,除了输入输出层,还应该包括卷积CONV层、池化Pooling层、全连接层,进而通过相关的得分函数输出分类概率,例如图片包含战场辨别敌军坦克的概率为96.35%.卷积神经网络作为一个媒介,一层一层把提供的原始图像数据转换成为最后的类别得分。其中,卷积层和全连接层包含权重和偏置,而RELU和POOLing层作为一个固定的函数运算。卷积层参数可看作一种有能力通过训练/学习进而达到目的的滤波器,在前向计算过程中,上层网络一定区域的数据和滤波器点乘后得到新的二维数据作为卷积层的神经元,滤波器按照一定的步长在原始数据上滑动,经过计算得出所有的新神经元,进而组成我们所需要的卷积层,如图2所示。
图2 卷积过程示意图
通过这种方式,卷积层的神经元只会和上一层的一些局部区域进行互相连接,如图3所示。每个所属的滤波器仅仅关注数据小平面内出现的部分特征,当出现它学习到的特征的时候,就会自动激活态,进行报警。
图3 卷积过程示意图
3 装甲图像训练集的获取与预处理
3.1 数据获取
训练样本的选取必须考虑客观性与代表性,努力与真实的应用场景相一致。本文中,除了包含各类装甲照片的正例样本,负例样本也必须是装甲车辆可能出现的道路、荒漠、草原、滩涂或丘陵。除了场景地域,样本还应体现季节变换、天气变化带来的植被改变与背景明暗差异,以及由于拍摄角度、障碍遮挡、目标运动等导致的形变问题。
2)风险管理是安全管理的一种,安全管理最终目标是本质安全管理,无论是风险管理还是隐患排查均是其手段. 本质安全管理强调从根源上着手保证系统安全并注重系统中各要素之间最佳匹配的一种状态[9]. 但目前,高速公路风险管理模式尚未从系统角度出发全面考虑外部相关组织与风险管理体系内部组织架构之间的有机联系.
基于装甲目标的图片样本获取,如果调用装备,采用无人机实地拍摄,可能会因审批困难、成本高昂、目标单一而中途夭折,并且得到的训练样本呈现高度一致化,将会导致过拟合现象出现。获取过程如下。
随着全球经济的一体化,在高科技发展迅猛的今天,我国各个行业已经进入了信息网络化、自动化的时代,各个行业各个领域都已经离不开信息技术,并在其中发挥了非常重要及关键的作用。通过现代化的信息技术可以更好的归类管理与储存档案信息,可以有效的避免了传统档案管理所存在的缺陷与不足。所以我们政府档案管理人员也应该积极的运用现代信息技术,把人才的优势充分发挥出来,建设一个能够满足本地发展的档案管理体系,这样不仅使档案的安全性得到提高,同时还能够使资料整合性得到有效提高。
3.1.2 编写爬虫
分析发现:① 管道的变形是对称的,位移以纵向位移(y轴)为主,最大位置在对称面处;② 在埋地段,管道在上覆土体压力作用下发生了椭圆化形变,使得管-土接触部位出现了水平径向(x轴)变形,所敷设的土体在管道作用下也出现相应程度的下沉,逐渐变得更加夯实;③ 管道顶部底部受到的应力较大,是结构分析的控制性截面,比较危险也易于破坏;④ 管道的最大应力发生在埋地和悬空的交界面附近;⑤ 在埋地和悬空的交界面的管土下接触面处,土体应力和轴向变形都比较严重,是土体易坍塌的危险区.
在百度输入“装甲”进入图片搜索,如图4所示。任意选中一张图片,查看源代码,找到图片对应地址objURL。
社区糖尿病患者在自行注射胰岛素的知识存在很多误区,注射行为普遍不规范。因此,社区医院应该积极承担起糖尿病管理的义务,普及糖尿病、胰岛素注射相关知识及技能。规范培训糖尿病专科护士,提高护士群体对血糖控制及胰岛素注射方面的认知。根据社区患者的特点,分层次、分阶段地实施教育与教育后管理,以提高胰岛素治疗的最终效果。
图4 图片搜索结果
3.1.1 网页分析
需要下载的图片很多,因而外部使用一个循环,由于可能存在网址错误,再加一个超时控制,当搜索时间超过3 s,跳出循环;将上述网址传入requests,编写出正则表达式;最后将下载的图片命名、保存。完整代码如图5所示。
0均值的具体实现方法:首先计算所有图片样本均值,然后每一幅图片都减去该均值,如此,将数据从标准坐标系下的一个个向量组成的矩阵,变成以上述这些求解的向量均值为原点构建的坐标系。
图5 图片爬虫源代码
3.2 数据预处理
本文的目标是检测出图片中是否包含装甲图像,属于一个二分类问题,输入为图片,输出为类别,包含地方目标装甲图像输出标签1,否则设置系统输出标签0.采用的Alexnet模型如表1所示。
图6 0均值与归一化处理
《麦克白》这部作品通过对麦克白这一主人公从英勇无畏的将军到野心与权欲日益膨胀的奸恶之人的人性悲剧的描写,揭示了这样一个真理:无尽的权欲与野心必然导致一个人人性的泯灭和人生的毁灭。这也启示读者:严于律己,努力让自己做一个有道德观念和法律观念的人,迎接美好的人生。
PCA实现过程:将原始图片转换成一个列向量,整个训练集即可组成一个原始矩阵A,对A归一化后,对A的协方差矩阵C进行求解;而后对奇异值分解(矩阵C),排列C的特征值与对应的特征向量;然后依据特征值大小,判别所有的特征现象,从而对所有特征向量进行降序排列,得到矩阵D.按照规定的信息提取规则提取D的前p列得到投影矩阵X;最后将所有系统训练图片向X投影即可得到降维后的所需数据。
4 基于Alexnet模型的装甲分类设计与实现
数据预处理的常用方法包括去均值、PCA(主成分分析)。深度学习实践中,样本均值较大会导致权值更新过大,各层之间相互影响,整个学习过程低劣而缓慢。为了解决这一困难,通常做法是在不改变数据相对位置的前提下,对数据进行集中,先期将样本数据进行去均值、归一化处理,改善数据分布。其做法是将数据从普通分布,变成0均值、单位方差分布,让训练易于收敛,如图6所示。
Alexnet的第一层结构是由卷积层组成的。第一层的输入为目标提供数据,由于深度学习的框架规则限制,系统对输入图片问卷大小有要求,因此统一将图片归一化为227×227大小的彩色图像,经过上述操作后第一次卷积操作和为11×11×3的大小,共用了96个滤波器,步长为4,那么该操作的神经个数就应该等于224×224×3=150 528.
通过卷积计算后的图片称为特征图,则卷积后的大小变为(224)/4-1=55,减一表示对于图片边缘需要删除,将处理后的55×55大小的特征图经过ReLu激活函数、Norm归一化,其输出数据的大小不会发生变化,之后再将卷积层连接池化层,给数据降维。最终输出特征图大小为27×27×96.两个卷积层之间的基本操作及结构类似于对第一层卷积层的计算,本次卷积操作中对新输入的特征图会进行一项填充操作,从而扩大小为5×5的卷积变为27×27,同时卷积核变为256个。池化操作降低维度为13×13,最终特征图大小13×13×256.第三个卷积层卷积核减小为3×3,同时也填充边长为1,滤波器的格式改为384个。ReLu的激活函数在第三层不连接池化层,因此最终输出的特征图大小13×13×384.第四个卷积层卷积核大小为3×3,因层数越深特征越抽象,也越重要,继续填充操作,之后进行ReLu,该层的卷积核不变。
表1 AlexNet各层结构的参数设置
输入图像大小(大小227×227×3) 卷积层1卷积核11×11,数量94,步长4,激活函数Relu输出特征图像大小:(225-11)/4+1=55即55×55×96 池化层1Kernelsize=3,stride=2输出特征图像大小:(225-11)/4+1=55即55×55×96 卷积层2卷积核5×5,数量256,步长1,激活函数Relu输入图像扩展2像素,输出27×27×256 池化层2Kernelsize=3,stride=2输出13×13×256 卷积层3卷积核3×3,数量384,步长1,激活函数Relu输入图像扩展2像素,输出13×13×384 卷积层4卷积核3×3,数量384,步长1,激活函数Relu输入图像扩展2像素,输出13×13×384 卷积层5卷积核3×3,数量256,步长1,激活函数Relu输入图像扩展2像素,输出13×13×256 池化层3Kernelsize=3,stride=2输出特征图像大小:66×66×256 全连接层14 096个神经元,dropout抽取4 096×1的特征向量 全连接层24 096个神经元,dropout抽取4 096×1的特征向量
第五个卷积层的卷积核为256,大小为3×3,填充大小为1,连接ReLu激活函数,之后连接池化层降维,设置步长为2,滤波器大小3×3,最终输出特征图为6×6×256.第六层网络结构为全连接层。将第五层的特征图作为输入,该层的神经节点个数为4 096,然后进行dropout,随机丢掉一些神经元或权重防止过拟合。本层最终输出节点为4 096个。第二个全连接层(fc7)是进ReLU(relu6)上一个全连接层(fc6)后进行随机丢弃操作全连接的所得到的结果。本层节点数目为4 096个。最后一层全连接层目的时对最终任务进行分类,本层输出节点2,二分类任务为2类对象。
特征提取是将训练样本映射到某个特征空间,缩小同类的特征距离,增大不同类间的特征距离,从而通过简单的分类器进行分类。特征提取后可以用监督学习的方法,学习得到两类问题的分类器,以判断目标出现在某一位置的概率。
5 结束语
本文基于卷积理论,研究如何从无人机拍摄视频、图片中提取装甲车辆目标,为指挥员决策提供依据。主要研究卷积模型的训练策略与过程,包括训练样本的选择、组织与预处理,卷积模型的改进与超参数设置,防止过拟合采取的策略,有效提高模型对装甲图片的识别效果。
定义1:设X是具有分布函数F的随机变量,若X1,X2,…,Xn是具有同一分布函数F的相互独立的随机变量,则称X1,X2,…,Xn为来自分布函数F(F称为总体或X称为总体)得到的容量为n的简单随机样本,简称样本.它们的观察值x1,x2,…,xn称为样本值,又称为总体X的n个独立的观察值.
参考文献:
[1]刘增良.模糊技术与神经网络技术选编[M].北京:北京航空航天大学出版社,2001.
[2]于功敬,厚泽,王振华.装备测试性设计与诊断策略优化技术研究[J].电子测量技术,2012,35(7).
[3]胡晓辉,张建国.基于改进卷积神经网络的图像超分辨率算法研究[J].计算机应用研究,2018(4).
[4]杨明,王冰,王春香,等.基于环视相机的无人驾驶汽车实例分割方法[J].华中科技大学自然报,2018(12).
[5]王潇天.基于深度学习的目标检测研究与应用[J].电子制作,2018(22).
文章编号:2095-6835(2019)07-0049-03
中图分类号:TJ810.1
文献标识码:A
DOI:10.15913/j.cnki.kjycx.2019.07.049
通讯作者:阮轶磊。
〔编辑:严丽琴〕
标签:卷积网络CNN论文; 卷积理论论文; 装甲车辆目标论文; 训练样本论文; 陆军装甲兵学院兵器与控制系论文;