第5卷(A版) 第11期2000年11月
中国图象图形学报
JournalofImageandGraphicsVol.5(A),No.11
Nov.2000
人脸识别技术综述
张翠平
苏光大
(清华大学电子工程系“智能技术与系统”国家重点实验室图形图象分室,北京 100084)
摘 要 首先对计算机人脸自动识别技术的研究背景及发展历程做了简单回顾,然后对人脸正面像的识别方法,按照识别特征的不同进行了分类综述,主要介绍了特征脸(Eigenface)方法、基于小波特征的弹性匹配(ElasticMatching)的方法、形状和灰度模型分离的可变形模型(FlexibleModel)以及传统的部件建模等分析方法.通过对各种识别方法的分析与比较,总结了影响人脸识别技术实用化的几个因素,并提出了研究和开发成功的人脸识别技术所需要考虑的几个重要方面,进而展望了人脸识别技术今后的发展方向.关键词 人脸识别 特征脸 小波特征 形状无关模型中图法分类号:TP391.41 文献标识码:
文章编号:1006-8961(2000)11-0885-10A
HumanFaceRecognition:ASurvey
ZHANGCui-ping,SUGuang-da
(ElectronicEngineeringDepartment,TheStateKeyLaboratoryofIntelligentTechnologyandSystem,
TsinghuaUniversity,Beijing100084)
Abstract Inthispaper,Researchbackgroundofautomaticfacerecognitionanditsrelationtohumanvisionsystemarebrieflyreviewed.Thencurrentfacerecognitiontechnologiesareroughlyintroducedandclassifiedaccordingtodifferentrecognitionfeatures.Fourmainalgorithmsareanalyzedandcompared.Thefirstiseigenface,whichisextractionofglobalfeaturesusingthePCA.Inthisapproach,asetoffacesisrepresentedusingasmallnumberofglobaleigenvectors,whichencodethemajorvariationsintheinputset.Thesecondisflexiblemodel,whichseparateshapeandgrayparameter.Thethirdiswavelet-basedelasticgraphmatching,inwhichmemorizedfacesarerepresentedbyregulargraphs,whoseverticesarelabeledbyamultiresolutiondescriptionintermsoflocalizedspatialfrequencies.Spatialrelationshipswithintheobjectarelabeledbygeometricaldistancevectors.Thelastmethodistraditionalanalyticaltechniques.Basedontheanalysisandcomparison,keyfactorsinfacerecognitiontechnologiesareconcludedanddistilledassuggestiontofutureresearch.
Facerecognition,Eigenface,Wavelet-basedfeature,ShapelessmodelKeywords
多了.其表现在:人脸表情丰富;人脸随年龄增长而
0 引 言
计算机人脸识别技术也就是利用计算机分析人脸图象,进而从中提取出有效的识别信息,用来“辨认”身份的一门技术.人脸识别技术应用背景广泛,可用于公安系统的罪犯身份识别、驾驶执照及护照等与实际持证人的核对、银行及海关的监控系统及自动门卫系统等.虽然人类的人脸识别能力很强,能够记住并辨别上千个不同人脸,可是计算机则困难
基金项目:清华大学科技发展基金;公安部资助项目::04-18
变化;人脸所成图象受光照、成象角度及成象距离等
影响;而且从二维图象重建三维人脸是病态(ill-posed)过程,目前尚没有很好的描述人脸的三维模型.另外,人脸识别还涉及到图象处理、计算机视觉、模式识别以及神经网络等学科,也和人脑的认识程度紧密相关.这诸多因素使得人脸识别成为一项极富挑战性的课题.
计算机人脸识别技术是近20a才逐渐发展起来的,90年代更成为科研热点.仅1990年到1998年
886
中国图象图形学报第5卷(A版)
之间,EI可检索到的相关文献就多达数千篇.由于人脸识别实验所采用的人脸库通常不大,最常见的人脸库仅包括100幅左右的人脸图象,如MIT库、Yale库、CMU库等人脸库均为小型库,且由于不同人脸库之间的输入条件各异,因此不同的识别程序之间很难进行比较.为促进人脸识别算法的深入研究和实用化,美国国防部发起了人脸识别技术(FaceRecognitionTechnology简称FERET)工程,它包括一个通用人脸库和一套通用测试标准.该FERET库可用于各种人脸识别算法的测试比较.1997年,FERET人脸库存储了取自1199个人的14126幅图象,其中同一人的图象差异,包括不同表情、不同光照、不同头部姿态以及不同时期(相隔18个月以上)拍摄差异等.如今FERET人脸库仍在扩充,并定期对各种人脸识别程序进行性能测试,其分析测试结果对未来的工作起到了一定的指导作用.由于FERET库中包括军人的图片,不能在美国以外获得,因此其他国家的研究只能采用本地的人脸库,如英国的Manchester人脸库[2].
通常,人类进行人脸识别依靠的感觉器官包括视觉,听觉,嗅觉,触觉等,一般人脸的识别可以用单个感官完成,也可以是多感官相配合来存储和检索人脸,而计算机的人脸识别所利用的则主要是视觉数据.另外,计算机人脸识别的进展还受限于对人类本身识别系统的认识程度.研究表明,人类视觉数据的处理是一个分等级的过程,其中最底层的视觉过程(视网膜功能)起信息转储的作用,即将人眼接收的大量图象数据变换为一个比较规则的紧凑表达形式.生理学的研究表明,人眼视网膜上存在着低层次和高层次的细胞.其中,低层次的细胞对空间的响应和小波变换的结果相似[2];而高层次的细胞则依据一群低层次细胞的响应,而作出具体的线、面乃至物体模式的响应.以此为依据,在计算机人脸识别中,可以将那些通过大量图象数据简单处理后获得的特征定义为低层次特征,而将线、面、模式等描述特征定义为高层次特征.由此,图象KL变换后的系数特征、小波变换特征及一些统计特征均属低层次特征的范畴,而人脸部件形状分析的结果则为高层次特征.由于视觉数据经传输后的重建,需依赖于人脑中早期形成的先验知识,因此在人的识别系统中,人脸的检测是一个整体识别和特征识别共同作用的结果[3];具体说来,远处辨认人,主要是整体识别,而[2]
[1]
另外,人脸的各部件对识别的贡献也不相同,如眼睛和嘴巴的重要程度大于人的鼻子,人脸上半部分重要性大于人脸下半部分,其中特别的人脸更容易被识别记住,比如说歪嘴,或是独眼龙等人脸就更容易为人记起,没有个性的人脸相对就需要更长的时间来辨认.根据对人脑的研究表明[3],人脸的表情识别和人脸识别虽然存在联系,但总体说是分开的、并行的处理过程.这些结论对于设计有效的识别方法起到了一定启发作用.在现有的识别算法中,特征脸方法[4]和神经网络方法[5]是基于整体人脸的识别,而基于提取眼睛等部件特征而形成特征向量的方法就是基于人脸特征的识别.