摘要:在基于 HMM 的人脸识别方法中,由于把奇异值向量作为观察向量是将整幅图的奇异值向量作为图像的特征,不能详细描述图像的局部细节。提出将图像分割成多子个窗口,然后选取子窗口的局部奇异值组成人脸特征向量,通过对观察向量的仿真结果表明,这种方法在提高识别率方面都有很大进步,优于直接采用灰度值法、二维离散余弦变换系数法或采用奇异值向量法。
关键字:人脸识别;局部奇异值向量;观察序列;隐马尔科夫模型
1 引言
隐马尔可夫(Hidden Markov Model,HMM) 理论最初是由 Baum 及他的同事于 20 世纪 70 年代初提出。隐马尔可夫模型是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。HMM 起初在语音识别面得到广泛的应用 。Samaria 最早建议了关于人脸的隐马尔可夫模型,他用灰度值作为观察值。Nefian 发展了 Samaria 的方法,他用二维离散余弦变换系数作为观察序列,这在一定程度上解决了 Samaria 的大量存储的缺陷。
2 隐马尔可夫模型简介
在隐马尔可夫模型中,状态不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一个概率分布。因此输出符号的序列能够透露出状态序列的一些信息。隐马尔可夫模型就是一种用参数表示的,用于描述双重随机过程统计特性的概率模型。一个潜在的过程称为“状态”过程,另一个可观测过程称为“观测序列”,观测序列是由隐含的状态过程决定的。
HMM 定义如下:
(1)X 代表一组状态的集合,其中, N S S S X ,...., , 2 1 ,N 为隐含状态数。
(2) O 代表可观察符号的集合 1 2 { , ,..., } M O V V V ,M 是从每一状态可能输出的不同的观察值的数目。
( 3 ) 状 态 转 移 概 率 分 布 { } ij A a , 这 里 1 { | },1 , ij i j t i a P q S q S i j N 。
(4)状态 j 的观察概率分布 { ( )} j B b k ,表示状态 j 输出相应观察值的概率,其中 ( ) { | },1 ,1 j t k t j b k P O V q S j N k M 。
(5)初始化状态分布 { } i , 1 { },1 i i P q S i N 。
使用简写的记法,HMM 可表示为三参数形式 ) , , ( B A 。将 HMM 应用到实际中,必须解决三个基本问题:
( 1 ) 估 值 问 题 。 即 给 定 观 察 序 列 1 2 ... T O OO O 和 模 型 ( , , ) A B ,计算 ( | ) P O 。
( 2 ) 解 码 问 题 。 即 给 定 观 察 序 列 1 2 ... T O OO O 和 模 型 ( , , ) A B ,求在某种有意义的情况下最优的相关状态序列 1 2 ... T Q qq q 。
(3)学习问题。即如何调整模型参数 ( , , ) A B ,对于一个给定的观察序列 1 2 ... T O OO O ,使得 ( | ) P O 最大。
3 基于HMM的局部奇异值分解算法研究
3.1 HMM 人脸模型
HMM 人脸模型最早由 Samaria 最早提出。这种模型是包含 5 个状态的左右模型。它把正面人脸图像分为 5 个显著的特征区域,即头发、额头、眼睛、鼻子和嘴巴。即使头部有一些偏转或倾斜,也可以认为这五个显著区域隐含着 5 个“状态”。则我们可以将观察到的序列看做是由 5 个状态产生的,我们可以通过观察序列对它进行估计。它的状态结构和非零转移概率矩阵 ij a 如图 1 所示。
图 1 用于人脸识别的左右型 HMM。
3.2 局部奇异值特征
奇异值分解是求解最小二乘问题的一种有效工具,在图像压缩信号处理和模式分析中得到广泛应用。若矩阵 A 代表一幅图像,对 A 进行奇异值分解为
T V U A 其中 U 和 V 是两个单位正交的矩阵, 是一个对角矩阵,为 ) ,..., , ( 2 1 n diag 。如果 A 只有 k 个非零奇异值,则 k i T i i i v u A 1 其中 u i 和 v i 是 u 和 v 的各个列、那么 T k n S ) 0 ,..., 0 , ,..., , ( 2 1 1 称为矩阵 A 的奇异值向量。因为对于任意一个实矩阵 A ,它的奇异值分解是唯一的,所以当排列 k ... 2 1 时,原图像 A 对应一个唯一的奇异值向量。于是奇异值向量可以作为描述灰度值矩阵 A 的一种数值特征。
图 2 是对采样窗进行奇异值分解得到的观察向量。从图中可以看出,奇异值向量的前面几个值很显著,后面的值迅速减小,趋近于 0,真正对图像描述起决定性作用的只与前面几个较大的值有关。
奇异值分解的特征保证了奇异值向量可以作为稳健的特征对人脸进行描述,比采用灰度值和二维 DCT 变换系数作为采样窗口的特征,识别率和速度都有所提高。但将整幅图的奇异值向量作为图像的特征,不能详细描述图像的局部细节;而且奇异值向量作为识别特征主要由前面几个显著值起决定作用。
图,2 状态的一个观察向量
为此可以采用局部奇异值向量的方法:先将图像分为多个小窗口,计算每个窗口的奇异值,然后从中选取出较大的奇异值构成一个一维向量来表示人脸特征。这样能更加充分地利用图像的细节信息,又增加了有效的特性,更好的反映人脸局部特征的差异。
3.3 特征抽取
我们用宽度为 W ,高度为 L 的采样对图像从上到下进行采样,如图 3,两个相邻采样窗之间的重叠部分为 P 。采样数也即序列的时间长度 T 由下式给出:
图 3 特征提取方法
参数 L 和 P 的选择在很大程度上影响着识别率。根据 Samaria在[6]中的经验,在 P 足够大的情况下( P ≤ L -1),系统的识别率不敏感于 L 。
3.4 HMM 的训练、识别流程
隐马尔可夫模型的训练就是要为每一个人确定一组经过优化了的 HMM 参数。每个模型可以用单幅或多幅图像进行训练。计算
按以下步骤进行:
(1)对人脸图像进行采样并计算每一个采样窗矩阵的奇异值,用奇异值向量作为观察序列。
(2)建立一个通用的 HMM 模型 ) , , ( B A ,确定模型的状态数,允许的状态转移和观测序列向量的大小。
(3)将训练数据均匀分割,与 N 个状态对应,计算模型的初始参数。
(4)用 Viterbi 分割取代均匀分割,重新进行参数的初始估计。
(5)采用 Baum-Welch 算法对参数进行重估计迭代调整模型参数以最大化观察概率。
这个过程的 HMM 参数被用来代表数据库中的人脸。
人脸识别的流程图可参见图 4。
图 4 HMM 识别过程
4 实验结果及结论
实验是在 ORL 人脸数据库上完成的,人脸数据库由 40 个人的400 幅图片组成,每人 10 幅,含各种表情。取每人 5 幅,共 200
幅进行训练,用另外的 200 幅进行识别。取 L =12, P =11,对采样串口的竖直和水平方向上等分,选取前面几个较大的奇异值构成局部奇异值向量,然后进行训练和识别,结果如表 3.1。
表 3.1 等分采样窗口识别结果
从表中可以看出当子窗口数为 1×1 时,即为基于奇异值分解的方法,由于观测序列长度小,所以识别率不高。当子窗口数为 2×4 时,本方法取得了 99%的识别率,可见对图像细节更加完备的表征弥补了观测序列少的不足。由此可见采用局部奇异值向量的方法优于传统的基于奇异值分解的方法。
参考文献:
[1]Rabiner L R.A Tutorial on Hidden Markov Models andSelected Applications in Speech Recognition[J].IEEE Proc,1989,35:267-295.
[2]Othman H,Aboulnasr T.Hybrid Hidden Markov Model forFace Recognition[J].4th IEEE Southwest Symposium ImageAnalysis and Interpretation.2000,15(11):36-40.
[3]Samaria F,Yong S.HMM Based Architecture for FaceIdentification[J].Image and Computer Vision,October.1994(12):537-583.
[4]Samaria F,Sam.Face Recognition using Hidden MarkovModels[J].PhD Thesis for University of Cambridge 1995(1):28-34.
[5]Nefian A V,Hayes M H.Face Detection and Recognitionusing Hidden Markov Models[J].International Conference onImage Processing,2002(1):141-145.
[6]Kanad T.Picture Processing System by Computer andRecognition of Human Face[J].PhD Dissertation KyotoUniversity,1973(6):86-92.
论文作者:王维列
论文发表刊物:《环球科学》2017年7期
论文发表时间:2017/9/14
标签:奇异论文; 向量论文; 状态论文; 模型论文; 序列论文; 图像论文; 特征论文; 《环球科学》2017年7期论文;