摘要:通过迁移学习的方法,利用人脸识别的改进VGGNet模型对Oxford-17 Flower和Oxford-102 Flower中的花卉分别进行训练与识别,实验证明了改进VGGNet模型对花卉的小训练样本同样明显提升了运算速度与识别度。
引言:
随着近年来大数据时代的兴起与计算机硬件的不断发展,深度卷积神经网络成为了人工智能的新的发展方向,与传统机器学习方法相比有着更为强大的特征学习与表达能力。由于花卉的本身具有一定的相似性加之自然环境有一定的复杂性,依靠传统机器方法并不能模型容易造成数据冗余,浪费计算能力。
为了针对地区花卉品种较少的花卉样本,我们提出使用改进VGGNet在较小的数据规模与小的计算能力对其进行训练,结果显示在小样本条件下完全符合预期要求。
正文
1.VGGNet神经网络
VGGNet是牛津大学视觉几何组VGG (Visual Geometry Group)小组开发的一个著名的应用于图片分类的卷积神经网络模型。且在2014年在ILSVRC比赛上获得了分类项目的第二名和定位项目的第一名。VGGNet网络与AlexNet[1]网络的框架有相似之处,但VGGNet更像是AlexNet的扩展版本,加深卷积层数来达到准确率提升的途径。通过VGGNet的相关文献我们了解到,VGGNet通过加深卷积层可以提升准确率但有一定的限度,有VGG16与VGG19两种。通过对两种的横向比较,我们最终选定利用VGG16作为我们的网络结构。
我们可以看出VGGNet是著名卷积神经网络模型AlexNet的扩展。相对于AlexNet网络,VGGNet作出如下有价值的改进
1)VGGNet网络使用连续3个3×3的卷积核替代1个7×7卷积核。对于C个通道的卷积核,7×7的卷积层含有参数72C2,而3个3×3卷积层的参数个数为3×32C2,因此使用参数的个数可大大减少。
2)使用3×3卷积核的原因是:3×3是可以表示“左右”、“上下”、“中心”三中模式的最小单元,同时采用较小的卷积核有利于更好地提取图像细节特征。更多的卷积层则增强了网络的非线性表达能力。
但我们也发现VGGNet网络不使用局部响应标准化LRN (Local Response Normalization) ,查阅文献表明,这种标准化并不能提升性能,却导致更多的内存消耗和计算时间[1]。同时VGGNet网络因为含有较大的训练量,但收敛的速度较慢,于是就需要花费大量的时间与运算资源,这一点对于计算能力有限的环境下开展VGGNet网络训练是十分困难的。于是我们参考LiteVGGNet[2]对模型进行改进。
2.改进的VGGNet模型[3]
我们通过减少全连接层以及使用均值池化层替换最大池化层,成功将VGGNet的参数由138M下降到了16M提升了运算速度。
3.模型训练与验证
我们通过使用Oxford-17 Flowers与Oxford-102 Flowers数据集对我们的模型进行验证。其花卉数据库的来源是牛津大学视觉几何实验室(Visual Geometry Group)。其中大部分花卉的图像来源与网络,一部分则由他们自己拍摄而成。因此,这两个数据库的花卉图像不但具有着实际花卉的真实图像,更具有研究的重要意义。在Oxford-17 Flowers数据集中,共有花卉1360张,其中共分17类花卉图像。而在Oxford-102 Flowers数据集中,共有花卉8189张,其中共分102种花卉图像。
我们按照之前预设计的方案对VGG16网络进行Fine-tune训练,并按照LiteVGGNet模型对其进行修改,最终得出我们的模型。Fine-tune的时候我们采取随机梯度下降法(Stochastic Gradient Desent,简称SGD),而不采用其他自适应学习率的优化算法,是为了保证网络参数以小幅度进行更新,这样可以防止预训练的特征被破坏。
测试结果:表中为识别率
我们可以看出,相对于VGGNet模型,LiteVGGNet模型虽然略微低于其,但需求训练样本个数和图片数量较小 能够适用于训练数据集较小的应用场景,对硬件计算力要求更低,因此该模型具有一定的实用性。
结语
为了针对VGGNet网络依赖大规模数据与计算资源的背景下,我们迁移了一种小模型下使用的VGGNet网络对花卉进行分类识别,并验证了其在小样本条件下的可行性。
参考文献
[1]Krizhevsky A,Sutskever I,Hinton G E.Imaganet classification with deep convolutional neura-1networks[C].Advances in Netural Information Processing Systems.Cambridge:MIT Press,2012:1097-1105
[2]Simonyan K,Zisserman A.Very deep convolutional Networks for large-scale image recognition[J].Computer Science,2014:1409-1556.
[3]喻丽春,刘金清.基于改进的VGGNet算法的人脸识别[J].长春工业大学报.2018,39(04),378-385.
作者简介:陈鸿博(1998-),男,天津市人,学历:大学本科在读,研究方向:通信原理;
杨鹤,符明东,符传斌,李根雨,单位:燕山大学。
论文作者:陈鸿博 杨鹤 符明东 符传斌 李根雨
论文发表刊物:《信息技术时代》2018年10期
论文发表时间:2019/5/14
标签:卷积论文; 花卉论文; 模型论文; 网络论文; 数据论文; 神经网络论文; 有一定论文; 《信息技术时代》2018年10期论文;