人脸识别方法的分析与研究
度值的圆形,因此在人脸图像清晰端正的时候,眼睛的提取是比较容易的。但是如果人脸图像模糊,或者噪声很多,则往往需要利用更多的信息(如眼睛和眉毛、鼻子的相对位置等),而且这将使得眼睛的定位变得很复杂。而且实际图像中,部件未必轮廓分明,有时人用眼看也只是个大概,计算机提取就更成问题,因而导致描述同一个人的不同人脸时,其模型参数可能相差很大,而失去识别意义。尽管如此,在正确提取部件以及表情变化微小的前提下,该方法依然奏效,因此在许多方而仍可应用,如对标准身份证照片的应用。
- - - 8 -
人脸识别方法的分析与研究
第3章 PCA人脸识别方法
3.1 引言
人脸识别技术是指当输入一张正面人脸图像时,识别该照片属于人脸库的哪一个人。其可应用于会议入场系统、罪犯识别及其它需要身份鉴别的场合。由于人脸图像是一个复杂的对象,而且人脸会随着表情、姿态、角度、光照的不同而呈现较大的不同,这些都增加了该问题的难度,使人脸识别成为国际上的难点和热点。解决人脸识别的方法层出不穷,如基于几何特征的方法、基于代数特征的方法等。主成分分析法(PCA)是把人脸图像看成高维向量,由于人脸图像的高度相关性,那么可以通过K-L正交变换将其转化为低维空间的向量,后者最大限度地保留了原数据的主要信息,是沿着其方差最大的方向求得的矢量。这样降维后的向量可以方便地用于模式识别。识别方法是最邻近距离分类法。
3.2 主成分分析
主成分分析法是统计学中用来分析数据的一种方法,它基于KL分解。最早将其用于
人脸识别中的是Pentland,并因为它的有效很快流行起来。简单地说,它的原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向征的向量和这个特征向量矩阵,可以完全重构出所对应的原来的高维向量[11]。 对应到人脸识别中,有如下的阐述:
对于一幅n x m的图像,将其列排列起来形成一个列向量v。假设人脸训练集中有p幅图像,则这p个列向量罗列起来形成一个(m x n) x p 维的矩阵X。 以x 表示一幅图像的列向量。
则训练样本集的总体散布矩阵为:
St??(xi-x)(xi-x)Ti?1p (3-1)
St为对称阵,可进行如下分解:
St?R?RT (3-2)
对每一幅图像xi进行变换(即在特征空间中进行投影)Yi?RTXi,则Y的协方差矩阵为:YYT?RTXiXiR?diag; 故经过PCA 变换去除了数据间的相关性,减小了冗余。
- - - 9 -
人脸识别方法的分析与研究
达到了降维的目的。
选取大的特征值,使总能量大于90%,即将特征值按从大到小排序,为:
?1??2????k????n,选取前k个特征值对应的特征向量,这叫做主成分。记主
mU成分矩阵为,则样本在该特征空间上的投影为:
W?UmX (3-3)
由前m个主轴决定的子空间能最大限度表达原始数据的变化,因为它在最小均方误差意义下是数据的最优表达。这样,对于要测试的人脸,将其在该子空间上投影,得到其坐标,和样本空间上各个人脸的坐标相比较,距离最近的即为该人脸的识别结果。在对行分解时,由于其维数很大,故借助于奇异值分解定理[12] 。
定理:设A是一秩为r的n×r维矩阵,则存在两个正交矩阵:
St进
U?[u0,u1,?,ur?1]?Rn?r UTU?I (3-4) V?[v0,v1,?,vr?1]?Rr?r VTV?I (3-5)
以及对角阵
??diag[?0,?1,?,?r?1]?Rr?r (3-6)
且
?1??2????r?1 (3-7)
满足
A?U?VT (3-8)
TTT其中: ?i(i?0,1,?,r?1)为矩阵AA和AA的非零特征值,ui和vi分别为AA和
12ATA对应于?i的特征向量。
推论 :
U?AV? (3-9)
T可构造矩阵S?XX,容易求出此矩阵的特征值和特征向量,那么应用以上的推论,
?12即可得到所需的特征向量和特征值。
所选取的特征向量构成了特征脸空间,这是一个降维的子空间,所有的人脸图像都可
- - - 10 -
人脸识别方法的分析与研究
以在此空间上投影从而得到一组坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。任何一幅人脸图像都可以表示为这组特征脸的线性组合,其加权系数就是K-L变换的展开系数,也可以称为该图像的代数特征。
3.3 特征脸方法
特征脸方法(Eigenface) 是从主成分分析导出的一种人脸识别和描述技术。PCA实质上是K-L展开的网络递推实现。K-L变换是图像压缩技术中的一种最优正交变换,其生成矩阵一般为训练样本的总体散布矩阵。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此可以采用K-L变换获得其正交K-L基底。对应其中较大特征值的基底具有与人脸相似的形状,因此又称为特征脸(Eigenface)。利用这些基底的线形组合可以描述,表达和逼近人脸图像,因此可以进行人脸的识别与合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征脸空间中的位置,具体步骤如下: 1.初始化,获得人脸图像的训练集并计算特征脸,定义为人脸空间; 2.输入新的人脸图像,将其映射到特征脸空间,得到一组权值; 3.通过检查图像与人脸空间的距离判断它是否为人脸; 4.若为人脸,根据权值模式判断它是否为数据库中的某个人;
5.若同一幅未知人脸出现数次,则计算其特征权值模式并加入到人脸数据库中。
任何模式识别系统都包括两个过程,一个是训练阶段((training process),另一个是测试阶段(testing process),应用PCA的人脸识别系统也不例外。假定在训练阶段,数据库中有K个人,每个人有M幅人脸灰度图像,其中每一幅图像都用N XN的二维数组I (x,y)来表示,数组元素表示象素点的灰度值。同样,每一幅图像都可以视为N个2x1的向量。
从一个特征集中选择有利于分类的特征子集的过程称为特征选择。经特征选择后特征空间的维数进一步得到压缩。特征选择也具有一些约束条件,如最小均方误差、总体熵最小化等。 模式特征可以分为物理的、结构的和数字的三大类。本文中应用于判别研究的模式特征是数字特征,这是由于计算机抽取数字特征方面的能力远远超过于人,这些数字特征包括统计平均值、方差、协方差矩阵、和特征值、特征向量以及矩等。特征提取所用的变换T就是基于K-L变换的PCA方法和Fishe:判别方法,而特征选择的约束条件就是最小均方误差。特征脸方法是一种简单,快速,实用的基于变换系数特征的算法,它存在如下优点:
(1)图像的原始灰度数据直接用来学习和识别,不需任何低级或中级处理: (2)不需要人脸的几何和反射知识;
- - - 11 -
人脸识别方法的分析与研究
(3)通过低维子空间表示对数据进行压缩;
(4)与其他匹配方法相比,识别简单有效。但是,由于特征脸方法在本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像,所以它有着很大的局限性,表现在以下方面;
(5)对尺度变化很敏感,因此在识别前必须先进行尺度归一化处理,而且由于PCA在图像空间是线形的,它不能处理几何变化;
(6)只能处理正面人脸图像,在姿态,发型和光照等发生变化时识别率明显下降; (7)要求背景单一,对于复杂变化背景,需首先进行复杂的图像分割处理;
- - - 12 -