摘要:隧道区域是高速公路管理的重点区域,行人和非机动车辆违规进入高速公路隧道内会严重影响高速公路的正常运行,造成巨大的安全隐患。因此,针对隧道环境下视频监控中的行人检测技术是高速公路正常运营的重要保障。隧道环境内,环境光照条件差,在图像中产生大量噪声,行人在隧道内目标小,像素低,给隧道环境下行人检测带来很大挑战。本文主要研宄了视频检测中的前景目标与背景目标的分割方法,使用了基于数学特征提取方法与卷积神经网络的行人目标检测方法。并且针对提取特征训练的分类器遍历搜索慢,在隧道场景下采用运动信息缩小搜索范围,节省了搜索时间。另外针对隧道环境下噪声大行人特征提取困难的问题,利用卷积神经网络对特征提取的优势特点,训练了端到端的隧道场景下行人检测网络。
关键词:隧道;行人检测;HOG特征;LBP特征;深度学习
引言
交通作为人类社会发展的重要基础,其智能化研宄对现代社会的发展至关重要。目前高速公路的修建中大量应用隧道,桥梁技术。例如昆明某高速公路出城方向,经过山地时需要隧道予以贯通,但是这样的交通要道往往也是一些行人和非机动车辆违规使用高速公路的高发区域,特别是在隧道中,光线差,道路狭窄,在车辆快速进出隧道时,由于环境光照变化等因素,会造成司机暂时性的适应性失明,如果此时在隧道中出现行人会给交通安全造成极大的隐患。所以说高速公路场景下行人与非机动车违规闯入是高速公路运营中一种常见问题,也是一个亟待解决的问题。
1基于特征设计的行人检测方法
在一般的监控环境中,摄像头的像素为640X480,车辆和行人往往同时出现,所以在一般的基于运动信息的检测中,难以对道路上的目标进行准确的识别,由于这个原因,在视频识别分析中,普遍使用提取特征训练分类器的方法识别道路上的运动目标。
在通用的数字图片中,一般使用像素表示图片的大小,640X480大小的图片我们即称这个图片由307200(=640X480)像素组成。从数学的意义来看,即可将此图片的特征维度称为307200维。即在一般的数字图片中,像素数即为此图片信息的维度。在数字图像识别的任务中将图片的特征维度表示为30万维显然是冗余的。比如在一张包含盒子的照片中,如果将盒子的边缘提取出来,使用这个边缘表示盒子,那么就可以通过人眼的观察知道,此图片中包含盒子。在基于机器学习的目标检测中,特征的设计具有将盒子边缘表示出来的同样的功能。
2基于组合方法的隧道行人目标检测
在一般的隧道中,由于灯光环境容易发生变化,导致在检测场景中出现类人形噪声,这样极容易造成窗口的误检,并且由于传统的遍历搜索策略极大的抑制了模型的实时性能,所以在隧道固定场景的行人检测中,单单基于原始的人工设计特征训练的分类器检测会出现检测速度慢,检测准确率低等问题,难以达到理想的检测效果。在这一章中我们提出两个改进方法用以提高分类模型的检测准确率和检测速度。
基于HOG特征的行人检测主要提取了行人在视频图像中的边缘,而图像中的行人重要特征包括行人的纹理分布。另外针对行人检测中一般使用窗口滑动的搜索策略,这样的方法在解决移动场景的行人识别中可以发挥长处,但是在固定角度的监控环境中,如本文的隧道监控环境中,遍历搜索策略极大的增加了计算的时间消耗,针对以上行人检测中的两个缺点,在本章中分别提出两个改进方法来提高隧道环境下行人的检测性能。第一,针对单HOG特征训练的行人检测器准确率较低的问题,通过引入LBP特征与HOG特征联合训练行人检测器进一步提高行人检测分类器的准确率,第二,针对固定场景下行人检测,使用一种改进的混合高斯背景建模方法提取行人疑似窗口,减小对于行人窗口的搜索时间。
期刊文章分类查询,尽在期刊图书馆
3基于深度学习的行人检测
在隧道环境下,视频监控中背景像素受到光照的影响,噪声大,环境光频闪严重,行人与背景像素的边界模糊,这就造成普通的运动信息与特征设计方法难以有效的提取场景中的行人信息。本章使用基于卷积神经网络的深度学习方法解决这一问题。深度学习作为机器学习的一个概念,是机器学习借鉴计算神经科学领域的一个工程实践,深度学习的概念区别于一般统计学习的概念,在深度学习与统计学习的分类上,深度学习更加偏向于计算神经科学的领域而统计学习则更加偏向于工程实践的概念。深度学习(deeplearning)的名字最早在2006年被多数学者接受并使用,仔细探宄深度学习的根源可以发现,深度学习的解决问题的观点与真实人脑的思考模型密切相关。所以,在深度学习的分类中,与计算神经科学的密切程度可以作为一种分界线。展示了支持向量机,提升算法等普通机器学习方法和深度学习之间的关系。在目前深度学习的研宄之中,深度学习有两个重要的特点,一种是深度学习的模型建立在大脑思维模式之下,这样对于如目标识别这样的智能型问题,具有强大的适应性。另一方面,深度学习这个概念在实践上采用分层组合的方法构建以工程为导向的模型,可以解决多种问题。深度学习应用于图像处理方面时,主要得益于Hubei和Wiesel发现小猫的视觉皮层处理图像机理,据此提出了局部感受野的概念。依据这个概念,经过多年的发展,Krizhevskyf在2012年将深度卷积神经网络应用于大规模的图像分类任务,并取得良好效果,本章主要基于深度学习中的卷积神经网络的概念,借助卷积神经网络优异的特征提取性能,通过改进区域卷积神经网络的功能,训练行人检测的卷积神经网络模型,并在隧道环境下取得良好的效果。下面将详细介绍卷积神经网络的工作原理与改进。
4成果
针对在隧道环境下使用单一HOG特征训练的行人检测器性能不佳的问题,本文通过引入LBP特征与HOG特征联合训练行人检测器,弥补了原始的行人检测方法只针对边缘特征训练分类器造成误检率较高的缺陷,通过使用纹理特征的LBP与HOG结合的方法进一步提高隧道内行人检测的准确率。
(2)针对在隧道环境下,监控摄像角度固定的特点,通过采用提取疑似运动区域的方法改进行人检测器遍历搜索的策略,减少搜索次数,在这个过程中比较了在隧道中行人运动区域提取的最佳方法,最终确定了将混合高斯背景建模方法作为图像帧中疑似运动区域的提取方法。探宄了在结合运动信息提取与行人检测器方法的情况下在隧道环境这种高噪声环境下组合行人检测方法的性能。
(3)在隧道环境中摄像机成像的噪声大,传统特征设计方法不能有效的提取行人特征,本文利用卷积神经网络对于目标特征优异的提取能力,将区域卷积神经网络的方法应用于隧道环境下的行人检测,针对行人检测的特点改进了基于行人的区域候选框生成网络,经过实验验证,经过改进的卷积神经网络可以有效提高噪声大的环境下行人检测的准确率。
结语
基于卷积神经网络的行人检测方法取得了优于本文其他方法的准确率性能,这一结果验证了本文关于使用卷积神经网络优异特征提取性能来实现噪声环境下行人检测的设想。卷积神经网络作为迄今为止深度学习领域最成功的图像处理工具,其在分类模型设计思路上与统计机器学习严格区分开,在大规模的图像处理任务中创造了绝对的优势。
参考文献:
[1]陈虹颖.隧道环境下行人目标视频检测技术研究[D].重庆大学,2013
[2]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3)
[3]徐一华,朱玉文,贾云得?一种人头部实时跟踪方法[J].中国图像图形学报,2002.7(1)
论文作者:徐以骞
论文发表刊物:《基层建设》2018年第25期
论文发表时间:2018/9/17
标签:行人论文; 隧道论文; 卷积论文; 特征论文; 神经网络论文; 环境论文; 深度论文; 《基层建设》2018年第25期论文;