- 09/13
- 2006
-
QQ扫一扫
-
Vision小助手
(CMVU)
摘要:本文首先分析了人脸的隐马尔可夫模型,实现了基于隐马尔可夫模型的人脸识别算法,给出了实验结果。针对图象亮度对识别的不利影响,提出了图象亮度自适应调整的算法,用这一算法加入到对人脸图象的训练和识别过程中并做了对比研究,用ORL人脸数据库所做的实验结果证明利用图象亮度自适应调整的算法可以有效的提高识别正确率。
关键词:马尔可夫链;隐马尔可夫模型;人脸识别;图象亮度自适应调整
1 引 言
计算机人脸识别技术是一种重要的个人身份鉴别方法,它能应用于刑侦破案、证件核对、保安监视、通道控制、人机交互等方面。由于人脸本身非常复杂,人脸图象又容易受光照、背景、姿态、表情等方面的影响,人脸识别成为模式识别领域当前的研究热点。现在,人们已提出多种人脸识别算法。在文献[1]中,作者把现存的人脸识别算法归为两大类:一类为基于几何特征的方法,通过提取人脸主要部件的参数构成一组向量,把它与数据库中描述人脸的向量比较,按照某种距离准则寻找最佳匹配向量作为识别结果,在识别率上不如第二类方法。另一类是基于模板匹配的方法,这种方法从人脸图象的整体出发,通过计算模板和图象灰度的自相关性进行分类识别,又可分为(1)基于代数特征的整脸识别技术,例如:PCA(Principal Component Analysis)方法、直接LDA (Linear Discriminant Analysis)方法、神经网络技术等 ;(2)基于图(Graph)的整体特征与局部特征相结合的识别技术,例如:弹性图匹配、局部特征分析等方法;(3)基于图象重建和图象合成的识别技术,如:Eigensignature 技术、3D增强的人脸识别技术等;(4)其它识别技术。在(4)中仅简要提及隐马尔可夫模型(Hidden Markov Model)等其它方法。文献[1]之后,出现了一些新的识别方法,如基于支持向量机的方法[2]、与小波变换相结合的识别方法等[3][4]。
本文在分析马尔可夫链、人脸的隐马尔可夫模型的基础上,实现了基于隐马尔可夫模型的人脸识别算法,给出了实验结果,由于图象亮度对识别的不利影响,提出了图象亮度自适应调整的算法,用这一算法加入到对人脸图象的训练和识别过程中并做了对比研究,实验结果证明利用图象亮度自适应调整的算法可以有效的提高识别正确率。
2 马尔可夫链(Markov Chain)
马尔科夫链是时间与状态都是离散的马尔科夫过程。数学上定义为:对随机变量序列Xn,在任一时刻n处于状态θ1,…θN,且在m+k时刻所处的状态qm+k的概率只与m时刻的状态qm有关,与m时刻以前所处状态无关,即:
其中,q1,q2,…,qm,qm+k∈(θ1,…θN),则称Xn为马尔可夫链[5]。马氏链所刻划的随机试验序列,可以直观的理解为要检测“将来”所处的状态与“现在”已知的状态有关,而“过去”的状态不起作用,这就是无后效性。
3 人脸的隐马尔可夫模型
隐马尔科夫模型(HMM)是一系列描述信号统计特性的统计模型,它包括一个基本的不可观察的马尔科夫链。马尔科夫链包括有限个状态、状态转移概率矩阵和初始状态概率分布。虽然状态是隐藏的(即不可直接观察),但状态能够根据概率分布(不管是离散还是连续的)产生观察量。HMM在语音识别及印刷体识别等方面得到广泛的应用,Samaria最早提出了人脸的隐马尔可夫模型[6],他用一个矩形窗从上到下采样人脸图象,将窗内的象素点排成列向量,用灰度值作为观察值,Nefian发展了Samaria的方法[7],提出了基于离散余弦变换的特征提取方法,用离散余弦变换系数作为观察序列,这在一定程度上解决了Samaria的大存储量的缺陷。对于一幅正面的人脸来说,马尔科夫的“状态”包括头发、前额、眼睛、鼻子和嘴巴,这5个状态以相同的顺序从上到下出现,即使是图像平面有少许的倾斜。因此,这些脸上的各个特征区域被指定为一个状态,即从上到下的一维连续HMM。
4 实验结果
实验是在ORL(Olivetti Research Ltd.)人脸数据库上完成的,采用VC++6.0编程。ORL人脸数据库是由40个人的400幅图象组成的,每个人的图象具有不同的表情和姿态,有的图象亮度很低。我们取每人5幅,共200幅进行训练,用另外的200幅用于识别。训练人脸的目的是为了识别,训练使用常用的Viterbi算法,训练结束后人脸库中人脸用一个隐马尔科夫模型表示。识别过程是首先从待识别的人脸得出隐马尔可夫模型,然后将此模型与人脸库中的人脸模型用Viterbi算法比较得出待识别的人脸与人脸库中每个脸的相似概率,识别结果即是相似概率最大的人脸。实验中根据相似概率的大小连续输出五幅人脸图象,以进行人脸身份识别。因为从应用的角度,人脸识别包括两大类:(1)人脸身份识别,即根据人脸图像识别出人物的身份,解决是谁的问题;(2)人脸身份确认或验证,判断图像中的人脸是否是指定的人,即解决是不是某人的问题,本文的识别算法用来完成人脸身份识别。
实验结果如下:200幅图象中,没有识别的35幅,占17.5%,一次识别115幅,占57.5%,五次识别165幅,占82.5%。与文献[6]、[7]的84%的识别率基本持平。
5 图象亮度自适应调整算法
在对图象进行训练和识别的时候作图象亮度的自动调整,因为图象亮度对图象的识别影响很大,尽管离散余弦变换能在一定程度上克服图象亮度的影响,但从前面的实验结果看效果并不很理想,本实验把图象的自适应调整算法加入到对人脸图象的训练和识别过程中显著提高了识别率。
算法过程:(1)求图象亮度的平均值。
(2)在128范围内根据平均值作自动调整。
实验结果如下:200幅图象中,没有识别的8幅,占4%,一次识别182幅,占91%,五次识别192幅,占96%。高于文献[6]、[7]的84%的识别率,与文献[4]的96.5%的识别率基本一致。
能正确识别和不能正确识别的部分图象如下图所示:
6 结论
本文实现了基于隐马尔可夫模型的人脸识别算法,针对图象亮度对识别的不利影响,提出了图象亮度自适应调整的算法,用这一算法更有利于把图象的特征提取出来,把这一算法加入到对人脸图象的训练和识别过程中并做了对比研究,实验结果证明利用图象亮度自适应调整的算法可以有效的提高识别正确率。从图3可以看出,不能识别的图象旋转或倾斜角度较大,以后将对这一问题作进一步研究。
参考文献:
[1] 李耀东,崔霞,肖柏华,等.自动人脸识别技术综述[J].计算机科学,2002,29(12):1~11
[2] 王宏漫,欧宗瑛. 基于支持向量机的人脸识别方法研究[J].小型微型计算机系统,2004,25(1):139~142
[3] 陈粟,倪林. 一种特征脸分析和小波变换相结合的人脸识别方法[J].计算机应用,2004,24(10):75~77
[4] 刘小军,王东峰,张丽飞,等. 一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J].计算机学报,2003,26(3):340~344
[5] 张宏林. Visual C++数字图象模式识别技术及工程实践[M].人民邮件出版社.2003.2:58
[6] Samaria F, Young S. HMM based architecture for face recognition[J].Image and Computer Vision,1994,12(10):537~543
[7] Nefian A V, Hayes Ⅲ M H. Hidden Markov models for face recognition[A]. In: Proceedings of IEEE International Conference on Image Processing[C],Michigan-Avenue,Chicago,Illinois,USA,1998:141~145