电子科技大学 610054
摘要:基于人脸特征的独特性、易提取、非接触式采集的特点,人脸识别技术正被广泛的用于身份识别。本文简要概括了和分析了人脸识别技术的基石——图像预处理技术,将图像预处理技术划分为归一化、图像增强、基于数学形态学的人脸图像处理三步,并简要分析了每一步里的关键步骤和技术,如直方图均衡化、高斯平滑滤波等。
人脸识别作为一种新兴的生物识别技术,被广泛用于支付识别、情绪识别、人员统计、公安系统身份识别等。不断增加的新兴应用,对人脸识别的精确性、及时性、可靠性提出了更高的要求。近几年来,随着硬件和软件的发展,人脸识别技术有了长足的进步。
目前来说,大部分的人脸识别都是基于摄像机对人脸进行成像,然后对人脸图像进行处理和分析而实现。人脸图像在成像、传输和处理中,会受到多方面多因素的影响,往往会让同一个人的人脸图像产生巨大的差异。因此,基于人脸识别的图像预处理就显得非常的重要。
图像预处理是图像分析的基石,计算机图形学中有极其重要的地位。图像预处理做的不好,会直接影响到接下来的图像信息处理与分析。不仅是人脸识别,当下其他热门的医学图像识别、卫星图像处理等技术,也十分倚重图像预处理。许多初学者和外行人只看重后面的图像信息处理和分析的核心部分,却忽略了前面的图像预处理,以为只是简单的几步按部就班的步骤就大功告成。殊不知,万丈高从平地起,看似简单的几步预处理,每一步都大有学问。预处理涉及的内容其实非常广泛,每一步怎么选、怎么做,都需要认真考虑。作为一栋大厦的基石,图像预处理如果没做好,后面的内容也会大打折扣,甚至会直接影响到图像分析的成败。故笔者特总结了常见的图像预处理技术,合并成一篇图像预处理综述。
对图像信息分析而言,如果给它一个具有不符合要求的特点的图像,可想而知,分析的效果和结果的精度会大打折扣。因而我们一定要有与之要求相匹配的图像预处理,这样才能让图像分析这栋高楼有更高的潜力。图像预处理要根据图像信息分析的要求,尽可能消除无关的信息、或会干扰有关信息的信息,将有用的信息真实的保存下来,并且加以增强处理,使之易被提取和分析。同时,当我们的图像样本过少、或者不均衡时,可以借助图像预处理,增加样本数量。抑或图像拍摄的角度各异,会造成结果很大的偏差,所以我们在图像预处理时需要将图像进行翻转处理,以提高处理模型的健壮性。
目前普遍采用的,基于人脸识别的图像预处理有三类,分别是:一、归一化。二、图像增强。三、基于数学形态学的人脸图像处理。
一、归一化
归一化是图像预处理的第一步。人脸图像被摄取后,图像的质量一定会受到不同的成像条件(成像角度、成像距离、光照强度、光照角度、人脸姿势等)的影响。归一化的正是于此应运而生。人脸图像归一化内容有二:几何归一化和灰度归一化。
1.几何归一化
几何归一化很好理解,他能根据不同的成像角度、成像距离和变化的人脸姿势,对人脸进行位置校准。故几何归一化也称为位置校准。
几何归一化的具体内容为人脸校正和人脸剪裁。
1.1.人脸校正
人脸校正的目的是解决人脸图像的旋转和尺度变化问题。人脸校正又具体的分为人脸尺度归一化(因为人脸图像尺寸大小不一)、平面人脸旋转矫正(因为有人脸会左右歪斜)、深度人脸旋转矫正(因为会有扭脸)三个环节。
1.2.人脸剪裁
人脸剪裁,顾名思义,即将人脸校正后的人脸图像从整体图像中进行剪裁。
2.灰度归一化
灰度归一化主要是为了应对图像成像的光照强度和光照角度等的变化而采取的手段,增加图像的对比度,以削弱单纯因光照原因而造成的图像信号变化的影响。
二、图像增强
完成了图像归一化后,下一步就要进行图像增强。通俗的讲,对图像按照后面图像分析特定的需求,凸显图像的某类重要信息或弱化一些无用信息就睡图像增强。
图像增强的目的是使要处理的图像的某些信息被处理(增强和弱化)后,更适合人眼的视觉特性或者更容易被机器识别及处理。在基于人脸识别的图像预处理中,图像的增强根据后面人脸分析的要求,使人脸的轮廓、五官特征、细节等更易识别(根据不同的人脸识别需求,所突出的细节和弱化的细节不同)。
图像增强在基于人脸识别的图像预处理中主要包含以下三方面的内容:灰度变换、图像变换和图像去噪。
1.灰度变换
灰度变换是指按照特定的变换关系或根据某种需求对图像的每个像素点进行逐个的像素灰度值的变换。
期刊文章分类查询,尽在期刊图书馆
通常来讲,灰度变换会把彩色图像转换成黑白图像,它能让图像的信息以更加具简单的方式表现出来。但是,有其利必有其弊,这样做会丢失图像信息。因此,我们尽可能用简单的转换方式去展现图像复杂的信息。
人脸图像的图像预处理中,灰度变换是为了改善人脸画质,使人脸图像的显示效果更清晰。
下面我们介绍一种常用的灰度变换技术:
直方图均衡化技术:
直方图均衡化的目的是使图像的每个像素点成为均匀分布的灰度直方图,变化的根据则是原本图像的灰度直方图分布。
经研究发现,具有较大动态范围和高对比度的图像具有的共同之处为它们的每一个像素点都几乎均匀的占据了整个灰度级分布。直方图均衡化技术的思想正是来源于此——将原有的需要处理的图像作为输入,使用累计分布函数作为变换法则,输出的图像正是我们要得到的结果。
输出的结果图像的特点非常符合前面提到的较大动态范围和高对比度,且灰度级近似于均匀分布的概率密度函数。
2.图像变换
图像变换指将图像转换到新的空间,使图像凸显出一些特性,方便进行特征提取,使得图像处理的过程更简易高效。
具体而言,图像变换的过程是将图像从空间域转换到变换域(如频率域)的过程。图像变换方法各异,有著名的离散傅立叶变换,也有有所耳闻的离散余弦变换等。
这其中,傅里叶变换是一种典型的频域变换技术。因为人脸图像在频率域中计算非常简便,且能量比较集中,所以二维离散快速傅里叶变换通常被用于处理人脸图像。将人脸图像从空间域转换到频率域,可以让较为复杂的人脸图像简单地用振幅潜来表征。
3.图像去噪
因为不理想的各种现实情况,我们得到的图像总是含有或多或少的噪音,他们可能来自成像设备,亦可能来自外部干扰。
图像去噪,顾名思义——削弱或消除数字图像中的噪声(图像中无用信息或干扰到有用信息的信息)。
从输入数据(有可能是连续的输入,亦可是离散的输入)中滤除噪声(图像中无用信息或干扰到有用信息的信息)的操作过程称为滤波,而滤波的程序称为滤波器。
滤波的输入输出是否是对应的线性函数关系?如果是,我们该类滤波叫做线性滤波。如果不是,则称非线性滤波。对应的,滤波装置有线性滤波器和非线性滤波器。下面对两种滤波方法进行详细介绍:
3.1.线性平滑滤波
线性平滑滤波中最常使用方法的是高斯平滑滤波法,因为数字图像的绝大部分噪声是高斯噪声。此外,广泛采用的还有加权均值滤波法、加权均值滤波法等,我们在这里仅介绍高斯平滑滤波法。
高斯平滑滤波法:
高斯平滑滤波的实现过程为,首先确定一个邻域,它是一个窗口范围。像素在这个窗口中间,这样针对每一个像素都有一个固定的窗口范围。扫描对每一个像素都进行扫描,每个像素所确定的窗口范围内的所有像素可以得到加权平均灰度值,用这个加权平均灰度值去替换原先的这个窗口中心像素点的值。
经过实验证明,高斯平滑滤波法可以有效削弱服从正态分布的噪声。
3.2.非线型平滑滤波
非线性平滑滤波的输入与输出是一种逻辑关系而非线性关系。线性平滑滤波中,每一个像素点输出结果是线性的,与该像素周围的像素是相关的。而非线型平滑滤波则不然,它的输出结果是非线性的,它通过对比邻域内的灰度值来实现,属于逻辑运算。它的模板是根据需要进行适应改变的,因而我们也写不出它的输入输出映射转移函数。
非线性平滑滤波方法的典型为中值滤波法,此外,还有最大值滤波器、最小值滤波器、中值滤波器等。限于篇幅,笔者在此仅介绍中值滤波法。
中值滤波法:
中值滤波器的基本原理是以局部中值代替局部均值。即在一个确定的邻域内,把每个像素点的值用该点的临域中各点值的中值代替。
中值滤波法的具体操作是,确定一个大于1的奇数N(N = 3,5,7,…),取N×N(N为前面确定的邻域)的邻域作为窗口。对每一个像素进行扫描,在每个像素对应的窗口内,选取窗口内N×N个像素点的灰度值的中间值,用中间值取代原有的邻域中心灰度值。
中值滤波法能有效消除孤立的噪声点,且不会造成边缘模糊,只会削弱离散的冲击噪声。
三、基于数学形态学的人脸图像处理
数学形态学是建立在格伦和拓扑学基础之上的一种新的图像处理方法,应用于图像处理和模式识别领域。
数学形态学图像处理可以看作是第二部分图像增强的补充,因为他们有相似的功能。但是数学形态学图像处理又明显的区别于图像增强。对比于图像增强,数学形态学图像处理有着一些明显的优势。
数学形态学基本的运算有腐蚀运算和膨胀运算(相对应)、开运算和闭运算(相对应)、骨架抽取运算、击中击不中变换等。
同时数学形态学主要有两类:二值形态学和灰度形态学。而基本的运算有腐蚀运算和膨胀运算、开运算和闭运算等。那么他们对应的运算就分别为二值腐蚀、二值膨胀…和灰度腐蚀、灰度膨胀…。此外还有骨架抽取运算、击中击不中变换等。
二值形态学和灰度形态学的区别主要在处理对象和结构元上。简单的理解,二值形态学处理的是平面点集,而灰度形态学处理的是灰度。
通过前面的介绍我们得知,我们对人脸识别图像预处理要求主要在于对人脸的特征识别,所以基于数学形态学的人脸图像处理应该更多的是使用灰度形态学的运算。
这里笔者仅介绍以下两种运算:
1.灰度膨胀运算与灰度腐蚀运算
有的学者认为膨胀和腐蚀运算属于我们前文提到的第二部分图像增强的非线形平滑滤波,这不足为奇。在各个学科中,我们都无法完全的把学科中的知识点完全的分离,如果要将它们分开,就一定会产生争议,就像我们的器官一样,他们既相互区别也相互联系,既相互协作也有同样的作用。当然了,这里笔者认为把膨胀运算和腐蚀运算归结于数学形态学图像处理更妥当。
灰度膨胀与灰度腐蚀的基本原理是以领域范围内的灰度极值代替像素点的灰度值。先指定一个某种形状的窗口,把这个窗口看作一个区域。以要处理的像素值为中心(一般来说是在中心)的区域内,用灰度极值替换掉该像素值。如果这个极值是最大值,那么是灰度膨胀运算;如果这个极值是最小值,那么是灰度腐蚀运算。
因此,灰度膨胀会扩大孤立的亮点,也会抹去一些高亮的重要细节。灰度腐蚀会扩大孤立的低亮噪音,并且抹去低亮的重要细节。
2.灰度开运算和灰度闭运算
灰度开运算和灰度闭运算是对应的。
同时,他们是在灰度腐蚀和灰度膨胀的基础上得到的。灰度开运算是“先腐蚀再膨胀”,而灰度闭运算则是”先膨胀再腐蚀“。
前面介绍到,较小的亮细节在灰度腐蚀中会被消除,但是在随后的灰度膨胀并不能被恢复,从而造成这些较小的亮细节丢失。所以灰度开运算断开了细小亮细节。同理,灰度膨胀运算除去了较小的暗细节,而这些细节在灰度腐蚀运算中没能恢复。所以灰度闭运算断开了暗小细节。
参考文献:
[1]刘新业.基于人脸识别的人脸图像预处理研究[J]. 沈阳教育学院学报,2009,10(2):83-85.
[2]吴玲.人脸识别的中的图像预处理技术[A]. 武汉:中南论坛,2010,(4):116-118.
论文作者:霍胜铭,, 黄祉衡,,张新盈
论文发表刊物:《科学与技术》2019年第07期
论文发表时间:2019/9/3
标签:图像论文; 灰度论文; 形态学论文; 的人论文; 像素论文; 平滑论文; 中值论文; 《科学与技术》2019年第07期论文;