(黑龙江大学,黑龙江 哈尔滨 150000)
摘要:针对视频监控中的低分辨率识别问题,本文介绍了研究现状和存在的问题,对于传统LR人脸识别算法作了详细的介绍。然后针对传统研究算法存在的问题与不足,又介绍了目前研究最火热的基于深度学习的超分辨率重建人脸识别算法并对未来的发展趋势作了简单的叙述。
关键词:深度学习;人脸识别;超分辨率;监控视频
1.前言
随着“平安城市”、“智慧城市”等国家政策的提出,安防受到全面重视。而“雪亮工程”、“天网工程”更是偏重于以视频监控系统为基础,从人体固有特征出发,对个人身份进行认证鉴定。人脸作为最重要的身份特征之一,具有非接触、非侵犯性等优点,与监控视频中监控对象非接触的特点相契合,因此监控视频中人脸识别获得了快速的发展。
2.存在的问题和研究现状
视频监控中的人脸识别技术,与传统的对静态图像的人脸识别不同,不是人脸迎合摄像头,而是由摄像头来捕捉人脸。监控系统是在非约束状态进行人脸采集的,易受光照、所处人群、角度、环境、表情姿态等因素的影响,多数是模糊的、质量偏低的、低分辨率的,这造成了数据库中的正面高清图像与监控系统获取的真实画面存在较大的差异。因此要想达到比较好的识别效果,人脸识别技术首要解决的问题就是这个问题,即低分辨率人脸识别问题。
目前业内一般把低分辨率人脸识别分为两种:一种是直接方法,即分辨率稳健特征表达方法,另一种方法是间接的方法,即对低分辨率样本进行超分辨率重建,得到含有较多特征信息的高分辨率图像,然后再使用常规人脸识别方法进行识别。
3.传统低分辨率人脸识别
LR人脸识别与SR人脸识别过程类似,分别对基准集和测试集样本提取分辨率稳健特征,对所提取特征进行比较,得出身份判定结果。与SR图像不同之处在于维度的不匹配,所以传统的解决思路又三种:
3.1 上采样
即图像插值,如最近邻插值、双三次等。对LR图像进行上采样操作,即在现有的人脸信息上拟合新的像素点,使其变换成与参考图像具有相同尺寸的高分辨率图像,然后再提取特征,利用传统人脸识别方法进行分类识别。
3.2 下采样
即图像缩小,将SR图像下采样到和待识别LR图像一样的尺寸大小,再提取特征,直接和LR待识别图像提取的特征进行匹配,虽然解决了维度不匹配问题,不会产生噪声,但会减少鉴别性的人脸信息。
3.3 统一特征空间
即中间分辨率空间。对SR图像进行特征降维,LR图像进行特征扩展,映射到同一特征空间中。统一特征空间直接解决特征维度不匹配问题,但最优的非线性耦合映射并没有较好的方法直接获取,由于是从两端的样本集同时向统一空间映射,复杂的变换会带来新的干扰。
4.超分辨率重建的低分辨率人脸识别
图像超分辨率(super resolution,SR)技术旨在提高低分辨率(low resolution,LR)图像的分辨率,同时最小化附加视觉伪影,人脸超分辨率重建,也称为“人脸幻想”。主要有基于插值、重建、学习的三种重建算法。
4.1 基于插值的重建方法
该方法主要有最近邻插值、双线性插值以及三次插值等方法,理论依据是假设图像为连续的,那么图像新增位置的像素可以通过相邻像素值计算得出,从而实现图像的超分辨率重建。该类方法只是增加了图像像素的个数,而没有增加额外的高频信息,因此图像的质量不是太高。
(1)最近邻插值
最近邻插值法是最简单的灰度值插值,将变换后的图像中的原像素点最邻近像素的灰度值赋给原像素点。
期刊文章分类查询,尽在期刊图书馆
(2)双线性插值
在x,y方向上分别进行一次线性插值,对目标图像(x,y)先通过最近邻插值映射到源图的(X+u,Y+v),u、v是小数部分,由于图像坐标都为整数,因此上述点不存在,所以取其附近四个领域点(X,Y)、(X,Y+1)、(X+1,Y)、(X+1,Y+1)的像素值,进行权值计算,得到目标图像(X,Y)处的像素值达到重建的目的。
(3)双三次插值
对周边16个点进行插值运算,具体可描述为目标图像(X,Y)坐标先映射到源图像的坐标(X+u,Y+v),接着找到该点最近的16个像素点将每个点的像素值按照不同的权值求和即得到待插值点的像素值。
4.2 基于重建的重建方法
其原理是通过观测LR样本来实现对SR的约束。通常用未知HR的先验知识作为正则化项来规范SR重建这个病态问题的解,确定性和随机方法是实现正则化的两种不同方式。
(1)最大后验概率算法(MAP)
该算法先给图像一个先验模型,模型由马尔可夫随机场确定,接着根据LR图像系列,实现目标SR图像达到最大后验概率。一般分为三个步骤:一、用两个随机的过程分别表示输入的LR和SR图像;二、接着使SR图像的后验概率值最大值;三、将后验概率的最大值公式按照贝叶斯公式进行转换然后取负对数。
(2)迭代反向投影法(IBP)
这是一个重复迭代的过程,先假设一个初始值,该值表示SR图像得到的期望,模拟SR图像的拟合过程,得到对应LR图像的集合,将该集合与待识别的LR图像集合求解误差返回到初始值,然后初始值做出相应的修正得到一个相对接近的值,重复上述过程,通过多次的迭代修正已达到误差函数值最小。
4.3 基于学习的重建方法
该算法更注重利用训练样本获得先验知识。其原理是输入LR图像后,提取其中一块图像并在训练字典中搜索合适的训练LR图像块对应的SR图像块来估计HR图像。利用训练集中的LR和SR图像块到SR图像块的某种映射关系,最后把估计的SR图像块结合在一起即重建的SR图像。
(1)基于稀疏学习的方法
该方法的利用了这样一种思想:一幅图像能够在非常苛刻的条件下有它的一组在超完备字典上的稀疏稀疏表示。在超分辨率重建过程中需要两个过完备字典:SR字典DS和LR字典DL,由观测图像求解在DL下的表示稀疏,由此表示系数与DS的线性组合得到高分辨率图像。
(2)基于深度学习的方法
基本思路是用卷积神经网络在LR图像与SR图像之间学习一个端对端的映射,经过多个卷积层提取图像特征,再由激活函数修正线性单元进行修正,使得卷积神经网络具有稀疏性,通过学习得到重建的SR图像。研究表明增加卷积网络深度可以提高重建质量。
5.总结:
LR人脸识别技术具有非常重要的理论意义和应用价值,随着视频监控系统的普及,监控视频中的人脸识别成为学者们的研究热点之一,并取得了很多成果。深度学习的飞速发展极大的促进了人脸识别技术的进步,相信深度学习SR技术将会是以后研究的一个热潮。
参考文献
[1]蒋春利,李政林,罗文广,等.智能家居监控及安防系统设计[J].自动化仪表,2017,38(11):13-16,21.
[2]Li B,Chang H,Shan S,et al.Low-resolution face recognitionvia couped locality preserving mappings[J].IEEE Signalprocessing letters,2010,17(1):20-23.
[3]肖哲.基于统一特征空间的低分辨率人脸识别算法[D]. 哈尔滨工业大学, 2014.
作者简介:王鑫(1995.06—),男,贵州省六盘水市人,哈尔滨市南岗区黑龙江大学 信息与通信工程 2018级 硕士 信号与检测。
汪国强(1963.09—),男,黑龙江省哈尔滨市人,黑龙江大学电子工程学院副院长,在职教授,研究方向为智能视频监控、图像处理等。
论文作者:王鑫 汪国强
论文发表刊物:《知识-力量》2019年3月中
论文发表时间:2019/1/2
标签:图像论文; 特征论文; 插值论文; 方法论文; 像素论文; 分辨率论文; 的人论文; 《知识-力量》2019年3月中论文;