龙源期刊网 http://www.qikan.com.cn
人脸识别研究综述
作者:李苗在,谷海红
来源:《电脑知识与技术》2011年第24期
摘要:该文对人脸识别的主要方法进行了系统的介绍,阐述了人脸识别研究的发展历史中技术和方法的演变以及国内外的研究现状,并对人脸识别研究可能的发展趋势作了展望。 关键词:人脸识别;特征提取;模式识别;综述
中图分类号:TP18文献标识码:A文章编号:1009-3044(2011)24-5992-03 The Review of Face Recognition LI Miao-zai, GU Hai-hong
(Hebi Occupation Technology College, Electronic Information Engineering, Hebi 458030, China) Abstract:This paper analyzes the main methods of automatic face recognition and elaborates the evolution history and the current situation of the relevant research. Several promising directions for future research are also proposed in this paper.
Key words: face recognition; feature extraction; pattern recognition; review
人脸识别技术的研究涉及图像处理、模式识别、机器视觉、人工智能、认知科学、生理学、心理学等多个学科,人类视觉识别系统的特性对机器人脸识别有一定的借鉴意义,心理学和神经生理学的研究无疑对机器人脸识别具有启发性[1-2]。但除少数文献外,目前大多数的机器人脸识别研究独立于生理学和心理学之外。本文将对人脸识别方法及其研究状况进行综述。 1 人脸识别研究的发展状况 1.1 发展历史
早在1888年和1920年Galton就在《Nature》上发表过两篇关于利用人脸进行身份识别的论文。真正意义上的自动人脸识别的研究开始于二十世纪六十年代中后期,1965年Chen和Bledsoe的报告是最早的关于自动人脸识别的文献。
1965到1990年之间是人脸识别研究的初级阶段,这一阶段的研究主要集中在基于几何结构特征的人脸识别方法(Geometric feature based)。该阶段的研究基本没有得到实际的应用。 1991年到1997年间是人脸识别研究非常活跃的重要时期。出现了著名的特征脸方法(Eigenface),该方法由麻省理工学院的Turk和Pentland提出,之后有许多基于该方法的研
龙源期刊网 http://www.qikan.com.cn
究。Brunelli和Poggio在1992年对基于结构特征的方法和基于模板匹配的方法进行了实验对比,并给出了后者优于前者的明确结论。该时期内,美国国防部资助的FERET(FacE Recognition technology Test)项目资助多项人脸识别研究,创建了著名的FERET人脸图像数据库。该项目极大地促进了人脸识别算法的改进以及算法的实用化。
1998年至今,研究者开始针对非理想条件下的人脸识别进行研究。光照、姿势等问题成为研究热点。出现了基于3D模型的人脸建模与识别方法。在商业化的应用方面,美国国防部在2000年和2002年组织了针对人脸识别商业系统的评测FRVT(Face Recognition Vendor Test),比较领先的系统提供商有Cognitec, Identix和Eyematic。 1.2 主要公共数据库
人脸数据库对于人脸识别算法的研究是不可缺少的,而公共人脸图像数据库的建立方便不同研究者之间的交流学习,并有助于不同算法的比较,下面列举常用的人脸图像数据库。 FERET人脸数据库:是FERET项目创建的人脸数据库,该库包含14,051幅多姿态、不同光照条件的灰度人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。
ORL人脸数据库:包含40人共400张面部图像,部分图像包括了姿态、表情和面部饰物的变化。该人脸库在人脸识别研究的早期经常被人们采用,由于变化模式较少,多数系统的识别率均可以达到90%以上。
AR人脸库:包括116人不同光照、表情、遮挡和老化的人脸图像共3288幅。 MIT人脸数据库:由麻省理工大学媒体实验室创建,包含16位志愿者的2,592张不同姿态、光照和大小的面部图像。
Yale人脸数据库:由耶鲁大学计算视觉与控制中心创建,包含15位志愿者的165张图片,包含光照、表情和姿态的变化。
PIE人脸数据库:由美国卡耐基梅隆大学创建,包含68个人的41,368张多姿态、光照和表情的面部图像。
CAS-PEAL人脸数据库:该人脸库包含了1,040名中国人共99,450幅头肩部图像,涵盖姿态、表情、饰物和光照四种主要变化条件,部分人脸图像具有背景、距离和时间跨度的变化。 BANCA人脸库:BANCA项目资助创建,包含208人的多模态生物特征,覆盖了不同图像质量、不同时间段等变化条件。 1.3 研究现状
龙源期刊网 http://www.qikan.com.cn
人脸识别是当前图像工程领域的四大研究热点之一,世界上很多国家的高校都有专门的人脸识别研究小组,比较著名的有:麻省理工学院,卡耐基梅隆大学,耶鲁大学,密歇根州立大学,加州大学洛杉矶分校(UCLA),曼彻斯特大学,南加州大学,萨里大学等。国际会议IEEE International Conference on Automatic Face and GestureRecognition和International Conference on Audio and Video-based Biometric Person Authentication是针对人脸识别及其他生物特征识别技术方面的会议。模式识别,机器视觉,图像处理等领域中最权威的国际会议,如IEEE CVPR,IEEE ICCV,IEEE ICIP,IEEE ICASSP,ECCV,ICPR每一届都对人脸识别领域的研究给予关注。
国内的许多研究机构在自然科学基金、863计划等资助下从事人脸识别领域的研究工作并取得了一定的成果。国内主要的研究机构和研究人员包括:清华大学计算机系人机交互与媒体集成研究所的徐光佑教授、艾海舟教授;清华大学自动化系的边肇祺教授、张长水教授;中科院计算所的高文教授、陈熙霖教授;中科院自动化所模式识别国家重点实验室的谭铁牛教授;北方交通大学的袁保宗教授;南京航空航天大学的陈松灿教授;南京理工大学的杨静宇教授;上海交通大学的施鹏飞教授;中科院自动化所(原微软亚洲研究院)的李子青教授领导的研究组等。此外,国内还有许多大学和研究机构在积极的从事人脸识别领域的研究,这些研究者在人脸识别领域积累了宝贵经验,近年来在国际知名期刊上发表了大量该领域的相关论文。 2 人脸识别的主要方法
一个自动人脸识别系统包括人脸检测以及人脸特征提取与识别两个关键环节。人脸检测指对输入的图像判断是否存在人脸,确定人脸的位置,分割出人脸。从原始图像分割出的人脸图像维数非常高,若直接用于数据处理,则运算难度大甚至对于已有计算机硬件是不可行的;而且原始的图像数据往往不能表现人脸的本质,不利于识别。因此,为了避免维数灾难(Dimensionality Curse)[3]并提高识别准确率,能够从高维原始数据中提取出用于分类识别的有用信息的特征提取技术是解决人脸识别问题的关键所在。人脸特征提取技术总的来说可以分为基于代数特征的方法和基于几何特征的方法两大类。
2.1 基于代数特征的方法
基于代数特征的方法是将人脸图像用特征向量表示,整幅图像看做一个矩阵,通过矩阵变换和线性投影来提取人脸特征并进行分类和识别。比较经典并被广泛使用的基于代数特征的方法有:主成分分析,Fisher线性鉴别分析,独立成分分析以及基于核的方法。
主成分分析:PCA(Principal Component Analysis),又称KL变换。该方法用KL展开式提取样本的主要特征。PCA的基本思想是利用一组包含离散度最大的特征来表示原始样本,它采用训练样本协方差矩阵的特征向量作为展开基,那些与较大的非零特征值相对应的特征向量被称为主分量,样本在这些主分量上的投影系数被称为为主分量特征,而原始样本可表示为