智能视频监控中的多人体目标检测与跟踪研究论文_李逢麒

中运海运科技股份有限公司

摘要:智能视频监控应用前景广阔,系统设计方式多种多样,尚无统一标准。在此背景下,本文对智能视频监控进行了简要介绍,分别从目标检测与目标跟踪两方面进行了研究,提出了有效检测与跟踪目标的设计策略,以供需要的人们参考,提高监控质量。

关键词:智能视频监控;人体目标;目标检测;目标跟踪

引言:典型视频监控具有信息采集、目标检测、跟踪、行为分析、事件检测等多个模块。视频监控随着网络的普及,目前,广泛应用在教育、娱乐、运动等各个领域,在安防工作中发挥了重要作用,因此,成为了热点研究内容。

一、智能视频监控概述

智能视频监控系统应具有多场景适应性高与高效准确处理数据的功能。构建该系统需要具备应用计算机视觉技术的能力,目前,国内外均十分重视对该系统的研究。本文所述智能视频监控系统主要为了发挥以下两个作用:第一,能够在复杂条件下实时更新;第二,能够对视频中的运动目标,主要是人的检测与跟踪。该系统融合了传感器技术、视频采集技术等众多新技术。不仅能够检测与跟踪具体人体模型,还能够对多人体进行检测与跟踪,实现了室内外多人体状态下的监控。特别强调的是,本系统构建的关键是图像的处理与识别。

二、智能视频监控中多人体目标检测研究

(一)顶层设计

影响监控系统发挥作用的因素包括像素、光照、分辨率等,上述影响多出现在十分极端的环境下,但是由于人眼的作用,一般均可有效识别目标。在此基础上,本系统为了充分展现其作用,对社会具有真正的推动性,拟研制可以超过人眼分辨率且适用于多场景的系统。鉴于针对多人体目标进行识别,加之上述因素的影响,在多人体检测方面,本文以人头检测为本,通过检测人头锁定目标。

(二)算法框架

人头检测不需要考虑实时性,算法只针对当前时间点进行处理,这就表示算法能够广泛应用在室内外多种场景中。算法运作原理是,当前帧输入图像后,将其传输到检测人头的网络模型中,网络得出分割结果与回归结果,之后再处理这两个结果,即经由阈值分割、极值点判断等,再结合场景目标群体数据锁定最终目标,输出坐标。

本系统采用深度卷积神经网络,通过有效训练能够输出处理后的检测结果,该网络输出结果更加准确。具体而言,该网络模式具有复杂性,能否成功应用的关键在于中间层监督效果,同时它制约了不同任务/领域的应用。本文所述系统对其进行了部分修改,以提高其兼容性与适用性。去除网络中位于最后的池化层以及其后部的连接,确保其能够接受任意规格的图像。进行四阶段池化操作,以有效缩小原图,同时提高输出精度。通过这一处理可以得到网络基本结构。经过实验后得到,该处理方法能够提取多人体预测图,具有实效性。

本文以VGG16为例,当然基础网络可以更改为其他类型卷积神经网络。而只需要结合实际情况予以更改,并保证采样倍数等于标准信息倍数即可。不难发现,在基础工序准备到位后,需要进行网络训练。其训练方法大致如下:与分类网络有所区别,应以目标类别数规格为本,压缩特征向量,使用SoftMax软件处理,之后改良预测值、标准值损失,在此基础上进行训练。想要实现人头检测需要具备同时进行前景分割与密度回归的效果,而通过Multi-task训练可以达到这一效果。训练时需要注意尽可能优化多任务参数,同时设置相应的约束,提高参数的相似度。本研究专门针

表示预测人头密度,Di表示真实人头密度[1]。

为完成训练,必须做好相应的准备工作。首先,选定场景,透视标定。由于场景中不同人头差异性较大,因此就某场景而言想要成功检测人头就需要实施透视标定。例如,选择某场景在该场景中选定几个位置的人予以标定,主要标注该人头到脚的长度,例如,平均长度170cm,经由长度、像素二者的换算,即可获取经过透视的像素点值。在此基础上,就可以分析不同区域多人体密度情况。采用这一方法采集数据。准备好数据后,需要进行网络训练。根据不同目的进行训练,例如,目的是经处理后输出的密

训练时间量与时间的增长而降低),初期需要保证拥有较高学习率,以确保后期学习率稳定有效。

(三)后续处理

完成训练之后,为了实现最终目标还需要进行后续处理。本系统针对检测功能的后续处理主要是指对图像的处理。首先,经由前景分割得到图像,进而将图像回归响应反射到人头区域;其次,采用增加连续阈值门限的方式消除目标粘连问题,经由极值点获得预测人头具体位置;最后,综合位置信息与场景坐标框出检测目标。

三、智能视频监控中多人体目标跟踪研究

(一)顶层设计

在检测目标的基础上融合目标跟踪能够发挥系统最大功效,更好地服务于社会。本研究在人头检测的基础上,融合颜色特征,以实现有效跟踪。具体设计如下:多人体运动目标跟踪的难点在于数据源不稳定,数据关联度低。因为欠缺对场景的了解往往不能预测目标数量,进而难以判定数据来源。在实际环境中加之噪声、障碍物等不确定因素的干扰,难度加大。想要成功进行目标跟踪,必须重视解决数据对应性,增加关联度。在前人探索研究的基础上,本文选择Kalman预测方法。该方法以目标颜色、形状为核心,因为人运动过程中其姿势、运动状态都可能发生变化,该方法能够在检测目标人头,进行锁定后对目标进行跟踪[2]。此时单一的人头已经不能实现目标的跟踪,因此,融合多人体颜色信息,以达到跟踪的效果。

(二)特征构建

颜色是本研究关注的重点,因此,构建系统时也纳入了颜色信息,同时对目标身高、运动方向、视角等信息也进行了采集,进而提高鲁棒性。从颜色角度来看,包括多种颜色比例与分布情况。本研究以颜色比例为基础,根据不同检测目标不同颜色占比得到分布直方图,最后使用直方图。但是直方图仅能够呈现出颜色统计特点,而不能得到颜色分布信息,因此,单纯以直方图跟踪信息远远不够,为了契合人类视觉,还需要联系空间信息。具体而言,建立立体模型,纳入红、绿、蓝三种颜色,分别设置R、G、B三种表示法。一般情况下,目标满足下述三个条件,第一,目标由多颜色组成;第二,目标像素分布具有规律性;第三,目标相邻颜色具有恒定性,因此,可将其作为跟踪基点。此外,人体目标头部、颈部颜色具有高度相似性,而跟踪目标的关键在于目标的差异性,因此,上述位置对于跟踪而言用处较低,在系统中予以去除。同时为了能够得到清晰的目标图像,将其分为两部分,比例为1:1,上半部分投影成水平向。本研究为了提高计算速度,实现实时跟踪,保证人体区域划分高度相关。

(三)颜色提取

模型识别中包含系统聚类与动态聚类两种方法。系统聚类是指根据函数情况逐步聚合,从多到少,直至分类适宜为止。动态聚类是指由检测目标出发,向中心聚集,获得新分类,如果新分类不合理则进行修改,直至合理。本研究选用动态聚类方法量化颜色图像。因为颜色种类存在不稳定性,因此,采用ISODATA这一较为简单的算法。

该算法具有二合一与一分二的特点,能够帮助使用者获得合理的结果。其应用步骤如下:第一,设计控制参数;第二,不同目标同中心的距离;第三,判断是否合理;第四,修改不合理的;第五,计算距离值;第六,计算多人体平均距离;第七,计算、分析等步骤,直至结果合理。经由上述步骤,就能够有效提取出目标颜色,满足使用需要。需要注意的是,应考虑下述内容:其一,设定目标相似性度量,本研究使用加权马氏距离与欧式距离的方式聚类分析目标颜色;其二,确定判断结果的准则函数,本研究使用类间距准则;其三,在给定初始值的基础上通过一系列运输进行优化,最终实现对目标颜色的提取[3]。

(四)跟踪方法

经由上述人头检测、目标颜色提取等,在系统中有效设计下述步骤即可实现对单个目标的跟踪以及目标融入多人体中后的跟踪。一是给定目标编号Num,获取目标坐标、颜色、身高、形状等信息。二是处理目标,划分区域,进行计算,为目标分配顺序号,得到目标均值、像素数目等。三是进行Kalman滤波预测,对目标进行判断,实时更新目标信息。四是发现多人相交,难以准确跟踪目标则进行更新预测。五是发现多人体分离,再次匹配特征,持续跟踪。

结论

本文所阐述了人头检测与颜色跟踪在特定区域能够取得良好的效果,但是仍不能避免缺点与不足,如在前期检测时指针对人头,忽视了对身高、颜色等的检测,后期锁定目标后纳入颜色、身高等数据,不免过于繁琐,降低了处理效率。对此,仍有待进一步研究,但学术研究永无止境,视频监控必会不断完善。

参考文献

[1]范峻铭.智能视频监控中的多人体目标检测与跟踪[D].电子科技大学,2018.

[2]谭晶晶.基于视频图像的人体检测跟踪研究[D].哈尔滨工程大学,2018.

[3]杭朱飞.智能视频监控中客流量统计算法的研究与应用[D].兰州理工大学,2016.

论文作者:李逢麒

论文发表刊物:《基层建设》2019年第29期

论文发表时间:2020/3/16

标签:;  ;  ;  ;  ;  ;  ;  ;  

智能视频监控中的多人体目标检测与跟踪研究论文_李逢麒
下载Doc文档

猜你喜欢