人脸识别综述论文_刘金莲

大众报业集团大众日报社 山东济南 250014

摘要:简要介绍了人脸识别的研究背景和研究意义;重点对近年来人脸识别常用方法进行分类总结,并对方法的优缺点进行了分析;总结了现阶段人脸识别存在的问题并提出今后的发展方向。

关键词:人脸识别;人脸检测;特征提取;神经网络

引言

人脸识别技术的研究始于20世纪50年代,当时的研究人员主要涉及的是社会心理学领域;最早AFR(Auto Face Recognition)的研究论文见于 1965 年陈(Chan)和布莱索(Bledsoe)在Panoramic Research Inc.发表的技术报告。近年来,人脸识别研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。尤其是 1990 年以来,人脸识别更得到了长足的发展。几乎所有知名的理工科大学和主要IT产业公司都有研究组在从事相关研究。

人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题。国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经在某些限定条件下得到了成功应用,人脸识别技术的研究对模式识别,人工智能,计算机视觉,图像处理等领域的发展有巨大的推动作用。

1 概述

人脸识别方法大致分为以下几种:基于几何特征、基于代数特征、基于神经网络模型以及基于三维模型。

(1) 基于几何特征

基于几何特征的人脸识别方法是在抽取人脸图像上显著特征的相对位置及其参数的基础上进行识别。最早的人脸识别是用手工的方法确定人脸特征点的位置并将其输入计算机中。识别工作的流程大体如下:首先检测出面部特征点,通过测量这些关键点之间的相对距离(欧式距离、马氏距离等),得到描述每个脸的特征矢量,比如眼睛、鼻子和嘴的位置和宽度,眉毛的厚度和弯曲程度等,以及这些特征之间的关系,用这些特征来表示人脸。比较未知脸和库中已知脸中的这些特征矢量,来决定最佳匹配。基于小模板匹配的方法属于几何特征识别,是已知一个小模板,在人脸的大图像中进行匹配,如果匹配成功,就可以确定其坐标位置[1]。

基于几何特征的缺点显而易见,对获得的图像要求很高,特征点的定位非常重要,通常人脸特征点的定位会存在误差,这种方法对正面人脸可以取得一定识别效果,如果人脸姿态存在一定的偏转或有遮挡都会很大程度上影响识别的准确性。

(2) 基于代数特征

基于代数特征的人脸识别方法具有代表性的是PCA(主元分析法)、K-L(卡胡南-列夫)变换和SVD(奇异值分解)等方法。其主要思想:对于一副由N个象素组成的图像,可以看作是一个N维矢量空间,采用不同的变换方法,能够有效的提取主分量,通过对人脸样本集的自相关矩阵的特征矢量的选取,构成一个正交的低维人脸空间,从而达到降低冗余、提高识别率的目的[2]。

利用主元分析法(Principle Component Analysis简称PCA)进行识别是由Anderson和Kohonen提出的。PCA方法最早由Sirovitch和Kirb引入人脸识别领域,并因为它的有效很快流行起来。简单地说,它的原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表征为一个低维向量,并不会损失任何有用信息。也就是说,通过低维表征的向量和这个特征向量矩阵,可以完全重构出所对应的原来的高维向量。

K-L变换与SVD分解的思想同PCA都差不多,降维到低维向量空间后要运算的分量大大地减少了。

采用代数特征识别人脸具有以下的特征:良好的稳定性;位移不变性;特征向量与图像的高度成比例变化;转置不变性等。但是代数特征对表情不能很好地描述,难以用于表情分析和表情识别。

(3) 基于神经网络模型

神经网络由许多并行运算的功能简单的单元组成,是一个非线性动力学系统,其特色在于信息的分布式存储的并行协同处理,具有良好的容错能力。神经网络主要的应用是对已经提取主特征的特征值进行分类。比较成熟的是PCA+ANN(主元分析+人工神经网络),用K-L+ANN(K-L变换+人工神经网络)[3]、SVD+ANN(奇异值分解+人工神经网络),也有直接用NN+NN(神经网络+神经网络)进行人脸识别的,不过这样所要计算的分量太大了,训练与工作的时间要长很多。

有代表性的神经网络模型有:BP网络、RBF网络、Hopfield模型等。如图1所示的是PCA+BP神经网络的例子,其中输入层结点的个数与主元分析后低维向量的个数相等输入到BP神经网络的输入层结点中,隐层结点的个数在构造BP网络时就已经定义好了,输出层结点的个数与样本的数量有关,要能达到分类的目的。

图1 BP神经网络

基于神经网络的方法,结构上类似于人脑,但由于原始灰度图像数据量十分庞大,神经元数目通常很多,训练时间很长,而基于冯诺伊曼结构也受到了限制。

(4) 基于三维模型

三维人脸识别[4]最初是从几何方法发展来的,出发点是希望利用三维的人脸识别处理技术,解决传统二维照片识别中因为人脸的姿态、光照等对识别造成的干扰问题,在三维的基础上进行特征的提取和识别将有更为丰富灵活详尽的信息可以利用。三维数据获取已经成为可能(如三维激光扫描技术、CT成像技术、结构光方法等),使得图形技术得到了应用的可能,可以完成人头三维面貌数据获取。

在合成特定人的头部模型时,需要一个基本头部模型,该模型是一个通用的模型,特定人的模型都可以通过对该模型的修改得到。人类面部特征的位置、分布基本上是一样的,因而特定人脸的模型可以通过对一个原始模型中的特征和其它一些网络点位置进行自动或交互调整而得到。系统的内部有一个原始的人头模型,以后所有特定模型的建立都是基于这个原始模型。

基于三维模型的识别方法是未来的对人进行识别的方向,因为在三维模型中,可以对人的头部从任意角度获得信息,具有良好的抗干扰能力,该方法的重点和难点是如何建立人脸三维模型以及如何在模型之间实现匹配。基于三维的人脸识别还需要做很多的工作,目前还没有什么实质性的研究应用成果。

2 总结

本文简单介绍了人脸识别的应用背景和意义,对人脸识别的四大主流方法进行了概述并指出了各方法的优点和缺点。

近年来人脸识别成为了最热研究课题之一,各国科技巨头和IT巨头对人脸识别,机器视觉领域的涉入更是推动了人脸识别技术的迅速发展,近几年不少人脸识别产品和系统进入了市场,比较有代表性的有Google Face++, Luxand,汉王人脸识别考勤系统等等。人脸识别技术虽然走向了应用并取得不错的成果,但是限制其应用主要难题依然存在:人脸姿态、光照变化和表情变化对人脸识别效果会产生很大的影响。后续对于复杂条件下的人脸识别将是主要的研究方向。

参考文献:

[1]章高清, 王申康. 人脸的层次化描述模型及识别研究[J]. 计算机研究与发展, 1999, 36(12): 1448-1454.

[2]周激流, 张晔. 人脸识别理论研究进展[J]. 计算机辅助设计与图形学学报, 1999, 11(2): 180-184.

[3]金忠, 胡钟山. 基于 BP 神经网络的人脸识别方法[J]. 计算机研究与发展, 1999, 36(3): 274-277.

[4]张九龙, 胡正国. 基于照片的人脸三维建模[J]. 西北大学学报 (自然科学版), 2001, 5: 43-45.

论文作者:刘金莲

论文发表刊物:《基层建设》2018年第35期

论文发表时间:2019/3/25

标签:;  ;  ;  ;  ;  ;  ;  ;  

人脸识别综述论文_刘金莲
下载Doc文档

猜你喜欢