基于PCA的人脸识别算法实现(4)

2019-04-09 15:41

重庆邮电大学本科毕业设计（论文）

68位志愿者的41368副不同姿态，多光照和不同表情的图像组成。ORL人脸数据库由剑桥大学AT&T实验室建立由40位志愿者的400幅图像组成，其中部分志愿者的图像还有姿态，表情和光照的变化。由于其人脸变化模式较少，现已很少使用。AR人脸数据库为西班牙巴塞罗那计算机视觉中心建立，由116人的3228幅图像构成。采集是在严格控制摄像机参数，光照变化，摄像机距离等条件下进行的。Essex人脸数据库是英国埃塞克斯大学的人脸数据库。任何人都可以下载它的人脸数据库，但是你不能发布，打印，销售或发行这些图像。这个人脸数据库由Libor Speacek博士主持的计算机视觉研究项目在维护。这个数据库由faces94，faces95，faces96，grimace四个库组成。这样做的目的是为了增加难度。Faces96和grimace是这个数据库最难识别的。它们的背景和比例是变化的，人脸表情是极度变化的。英国埃塞克斯大学计算机视觉研究项目鼓励研究者公布使用这个数据库取得人脸识别结果。我们在本文采用的是它的face94数据库。faces94数据库中人脸图像是在受试者坐在距离相机固定位置，并要求讲话的情况下采集而成。讲话的目的是为了采集面部表情的变化。每个图像的大小为180*200，图像的背景是蓝色的。有轻微的姿态变换，无光照变换。

国内人脸数据库有中科院计算技术研究所银晨科技面向识别联合实验室建立的CAS—PEAL人脸数据库。该数据库是基于目前的人脸数据库大多都较小或图像变化因素单一，人脸图像的多为西方人，其面部特征与东方人存在一定的差别，需要建立一个大规模，多因素的东方人脸数据库的需求建立的，共采集了1040位志愿者（595名男性，445名女性）的99450幅图像。该数据库根据不同的变化因素又分为7种模式子库。这7种变化因素为姿态，表情，饰物，光照，背景，距离和时间跨度，其中以姿态，表情，饰物和光照为主，故称为PEAL（pose，expression，accessory和lighting的简写）。CASE—PEAL—R1为CASE—PEAL的共享版，可以提供给研究人员用以研究使用。其中研究人员指的是研究生导师或其他固定职位的研究员，不包括学生。

第四节本章小结

本章主要介绍人脸图像获取，人脸分割和人脸数据库。在人脸图像获取和人脸分割两个小节中主要介绍常用的人脸获取方法及获取人脸原始图像后如何分割出我们需要部分的方法，也为后面人脸图像数据库打下了基础。在人脸数据库一节中，主要介绍了常用的人脸数据库及本文的实验是在Essex人脸数据库中我们选择出来的子库中进行的。这样做的目的是我们的工作中心集中在核心人脸识别算法的性能研究上。

- 11 -

重庆邮电大学本科毕业设计（论文）

第三章人脸图像的预处理

第一节人脸图像格式

在计算机中任何信息都是以文件的形式存储，图像信息也不例外，它经过采样，量化和编码后以图像文件进行存储，所以在人脸识别之前有必要介绍图像文件格式。图像的文件格式很多，本节只介绍本文常用的几种图像格式。

一、JPEG格式

JPEG文件格式是常用的图像文件格式。它是由联合照片专家组（Joint Photographic Experts Group）开发的，并且命名为“ISO10918-1”，JPEG仅仅是一种俗称而已。JPEG文件以.jpg或.jpeg为扩展名，其压缩技术非常先进。JPEG使用有损压缩方法去除冗余图像和彩色数据，获得了较高的压缩率，同时还可以给人丰富生动的视觉感受，即可以使用最小的磁盘存储较好的图像质量。它是一种灵活的格式，可以调节图像质量，允许使用不同压缩比例压缩文件。由于JPEG优异的品质和杰出的表现，它的应用也非常广泛，特别是在网络和光盘读物上，肯定都能找到它的影子。目前各类浏览器均支持JPEG这种图像格式，因为JPEG格式的文件尺寸较小，下载速度快，使得Web页有可能以较短的下载时间提供大量美观的图像，JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。

二、JPEG2000格式

JPEG2000是基于小波变换的图像压缩标准，同样由联合照片专家组（Joint Photographic Experts Group）开发和维护。JPEG2000通常被认为是未来取代JPEG（基于离散余弦变换）的下一代图像压缩标准。JPEG2000文件的扩展名为jp2。JPEG2000压缩率比JPEG高约30%左右，同时支持有损和无损压缩，而且不会产生原先的基于离散余弦变换的JPEG标准的块状模糊瑕疵。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输，即先传输图像的轮廓，然后逐步传输数据，不断提高图像质量，让图像由朦胧到清晰显示。此外，JPEG2000还支持所谓的\感兴趣区域\特性，可以任意指定影像上感兴趣区域的压缩质量，还可以选择指定的部分先解压缩。在有些情况下，图像中只有一小块区域对用户是有用的，对这些区域，采用低压缩比，而感兴趣区域之外采用高压缩比，在保证不丢失重要信息的同时，又能有效地压缩数据量，这就是基于感兴趣区域的编码方案所采取的压缩策略。其优点在于它结合了接收方对压缩的主观需求，实现了交互式压缩。而接收方随着观察，常常会有新的要求，可能对新的区域感兴趣，也可能希望某一区域更清晰

- 12 -

重庆邮电大学本科毕业设计（论文）

些。

三、BMP格式

BMP(Bitmap-File）图形文件是Windows采用的图形文件格式，在Windows环境下运行的所有图象处理软件都支持BMP图象文件格式。Windows系统内部各图像绘制操作都是以BMP为基础的。Windows 3.0以前的BMP图文件格式与显示设备有关，因此把这种BMP图象文件格式称为设备相关位图DDB(device-dependent bitmap）文件格式。Windows 3.0以后的BMP图象文件与显示设备无关，因此把这种BMP图象文件格式称为设备无关位图DIB(device-independent bitmap）格式。Windows 3.0以后，在系统中仍然存在DDB位图，只不过如果你想将图像以BMP格式保存到磁盘文件中时，微软极力推荐你以DIB格式保存。目的是为了让Windows能够在任何类型的显示设备上显示所存储的图象。BMP位图文件默认的文件扩展名是BMP或者bmp，有时它也会以.DIB或.RLE作扩展名。

BMP格式的特点是包含的图像信息较丰富，几乎不进行压缩，由此导致了它的缺点—占用磁盘空间过大。

四、GIF格式

GIF图像互换格式（Graphics Interchange Format）是CompuServe公司在 1987年开发的图像文件格式。GIF文件的数据，是一种基于LZW算法的连续色调的无损压缩格式。其压缩率一般在50%左右，它不属于任何应用程序。目前几乎所有相关软件都支持它，公共领域有大量的软件在使用GIF图像文件。GIF图像文件的数据是经过压缩的，而且是采用了可变长度等压缩算法。GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像，如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上，就可构成一种最简单的动画。在早期，GIF所用的LZW压缩算法是Compuserv所开发的一种免费算法。然而令很多软件开发商感到意外的是，GIF文件所采用的压缩算法忽然成了Unisys公司的专利。据Unisys公司称，他们已注册了LZW算法中的W部分。如果要开发生成（或显示）GIF文件的程序，则需向该公司支付版税。由此，人们开始寻求一种新技术，以减少开发成本。PNG（Portable Network Graphics，便携网络图形）标准就在这个背景下应运而生了。它一方面满足了市场对更少的法规限制的需要，另一方面也带来了更少的技术上的限制，如颜色的数量等。在2003年6月20日，LZW算法在美国的专利权已到期而失效。在欧洲、日本及加拿大的专利权亦已分别在2004年的6月18日、6月20日和7月7日到期失效。尽管如此，PNG文件格式凭着其技术上的优势，已然跻身于网络上第三广泛应用格式。与GIF相关的专利于2006年8月11日过期。

GIF格式的特点是压缩比高，磁盘空间占用少。目前互联网上大量彩色动画多为这种格式。

- 13 -

重庆邮电大学本科毕业设计（论文）

五、PNG格式

PNG，图像文件存储格式，其目的是替代GIF和TIFF文件格式，同时增加一些GIF文件格式所不具备的特性。流式网络图形格式(Portable Network Graphic Format，PNG)名称来源于非官方的“PNG's Not GIF”，是一种位图文件(bitmap file)存储格式，读成“ping”。PNG用来存储灰度图像时，灰度图像的深度可多到16位，存储彩色图像时，彩色图像的深度可多到48位，。PNG使用从LZ77派生的无损数据压缩算法。

PNG是目前保证最不失真的格式，它综合GIF和JPG两者的优点，存储形式丰富，兼有GIF和JPG的色彩模式。它能将图像文件压缩到极限以利于网络传输，又能保留所有与图像品质相关的信息。它的显示速度快，只需下载1/64的图像信息就可以显示出低分辨率的预览图像。PNG同样支持透明图像的制作。PNG的缺点是不支持动画应用效果。

第二节人脸图像常用预处理方法

一般，系统采集到的原始图像都会受到各种各样的噪声的影响而失真。并且由于各种条件的限制，采集到的原始图像不能直接进行使用，必须做预处理，即消除噪声，校正失真，将图像变化为标准形式。这样才有利于稳定的进行特征提取。常用的人脸预处理有：灰度变化，二值化，直方图均衡，图像滤波，图像锐化和归一化处理。

一、灰度变化

人脸识别的研究常以灰度图像为处理对象。因为彩色图像的颜色信息常常受到复杂背景的影响。利用彩色图像进行人脸识别存在较多缺陷，而灰度图像为一种最简单有效的对比增强方法。彩色图像有红绿蓝三原色组合而成，灰度图像只含有亮度信息，并且灰度图像的亮度为连续变化的，所以灰度图像要对亮度值进行量化，为0-255，共256个等级。0为全黑，255为全亮。常用的经验公式为gray=0.39*R+0.5*G+0.11*B.

常用变换的方法如下：

线性变换：假设图像为f(i,j)灰度变化范围为[a,b]，变换后的图像为g(i,j)灰度变化范围为[a,b]，则它们之间关系为

b'?a'g(i,j)?a?(f(i,j)?a)

b?a' （3.1）

分段线性变换：假设图像为f(i,j)灰度变化范围为[0,Mf]，变换后的图像为g(i,j)，目标的灰度变化范围为[a,b]，想使灰度变化到[c,d]，则对应关系为

- 14 -

重庆邮电大学本科毕业设计（论文）

?(c/a)f(x,y)0?f(x,y)?a?g(x,y)??[(d?c)/(b?a)][f(x,y)?a]+ca?f(x,y)?b （3.2）

?[(M?d)/[M?b]]?db?f(x,y)?Mfgf?非线性变换：使用非线性函数作为映射函数如对数函数，进行灰度变换。对数变换和指数变换分别为

g(i,j)?a?ln[f(i,j)?1] （3.3）

b?lnc g(i,j)?bc[f(i,j)?a]?1 （3.4）

其中a, b, c用来调整曲线的位置和形状。指数变换能对图像的高灰度区以较大的拉伸。对

数变换可以使图像低灰度区有较大拉伸而高灰度区进行压缩。对数变换可以使图像灰度分布相匹配于人的视觉特性。

二、二值化

二值化是通过选取适当的阀值将灰度图像的灰度值从0到255变换为只有0和255的黑白图像。在人脸识别中二值化用来把人的头发，眼睛，脸的轮廓及背影与人脸的亮域分开。在图像二值化过程中选择合适的阀值非常重要。常用的图像二值化选择方法如下：

整体阀值法：在二值化时候只使用一个全局阀值t。假设图像为g(n,m)，灰度范围为[k1,km]，t为k1和km之间选择的一个合适的灰度值，转换后的图像为gk(n,m)，则转换关系为

?0g(n,m)?t （3.5） gk(n,m)???255g(n,m)?t局部阀值法：它是根据当前像素的灰度值和此像素周围点局部灰度特征值来共同决定阀

值。

动态阀值法：它的阀值不仅和该像素和周围像素有关，还和该像素的坐标位置有关。整体阀值法适合图像质量比较好的情况，此时图像在直方图一般有两个峰值。局部阀值法可以处理比较复杂的情况，但有些情况会发生失真。动态阀值法适应性和性能都比较好，实际中对于人脸识别常采用此法进行二值化。

三、直方图均衡

直方图均衡是将将各灰度级分量尽量均匀分布，从而来增强人脸图像的对比度。此外它还能减少光照对人脸图像的影响，使人脸特征提取变得容易，同时还提高了人脸图像的主观质量。其主要在于根据图像灰度分布和实际的需求选择合适的映射函数。选择函数可以连续平滑函数，也可以是分段函数。映射函数为分段函数时一般是基于想要突出人脸图像中某些灰度值物体的细节，又不想牺牲其他灰度值上的细节的考虑。这样可以是需要的细节灰度值区间得以拉

- 15 -

共8页:

基于PCA的人脸识别算法实现(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档