论文部分内容阅读
人脸图像包含了大量信息,这些基本信息可以加工成更高级的用户信息,可用于了解人的情感与行为、人机交互等机器视觉领域,而要获取这些信息,通常需要先对人脸特征点进行检测。然而,在头部姿态变化的情况下,人脸的形状、尺度等特性发生很大的变动,给特征点的检测带来很大的挑战。因此,本文针对头部姿势变化下的特征点检测问题进行深入研究,提出一种能满足多姿态变化的人脸特征点检测算法,并将其应用在眼睛定位上,主要工作内容如下:(1)多姿态人脸特征点初始化。针对人脸特征点初始化对姿态变化敏感的问题,本文通过对不同人脸朝向的特征点分布趋势进行分析,提出一种基于人脸朝向分类的特征点初始化方法,对不同朝向的人脸采取不同的初始化策略。对于每一个待进行特征点检测的人脸图像,首先提取人脸图像的HOG(HistogramofOrientedGradient)特征,输入到已经训练好的随机森林决策树进行投票,得到其朝向分类标签。而后,不同的朝向选取对应训练子集中样本特征点的均值作为其初始化值。(2)对姿态变化不敏感的姿势索引特征的提取。为了增强多姿态变化下人脸特征点检测的鲁棒性,本文将传统的基于级联回归模型的人脸特征点框架拓展为正朝向、左朝向、右朝向三个方向,同时在对应的朝向下提出一种对姿势变化不敏感的特征——基于类内区域均值的姿势索引特征。首先,对人脸中关键部位的特征点进行聚类,随机取类内的特征点组成三角形区域模板集,接着在每个区域模板中选取若干个参考点,并计算其均值作为类内局部区域的输出,最后根据特征相关性分析得到局部区域特征对,作为姿势索引特征。本文提出的基于人脸朝向分类的特征点初始化方法,在不同朝向的姿势下取得很好的分类效果,在CAS-PEAL数据库和Helen-LFPW-300W混合数据库平均分类准确率分别达到95.8%、93.8%,同时得到的特征点平均定位误差要低于传统的随机初始化方法;基于类内区域均值的姿势索引特征,在Helen-LFPW-300W混合数据库中检测得到的人脸特征点平均定位误差要低于传统的姿势索引特征;同时将人脸特征点检测应用在眼睛定位上,得到的眼睛定位误差要低于传统统计学习的方法。实验结果证明,本文提出的初始化算法和姿势索引特征能较好的解决多姿态变化带来的问题。