多姿态人脸特征点检测算法研究及其在眼睛定位中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dfw002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸图像包含了大量信息,这些基本信息可以加工成更高级的用户信息,可用于了解人的情感与行为、人机交互等机器视觉领域,而要获取这些信息,通常需要先对人脸特征点进行检测。然而,在头部姿态变化的情况下,人脸的形状、尺度等特性发生很大的变动,给特征点的检测带来很大的挑战。因此,本文针对头部姿势变化下的特征点检测问题进行深入研究,提出一种能满足多姿态变化的人脸特征点检测算法,并将其应用在眼睛定位上,主要工作内容如下:(1)多姿态人脸特征点初始化。针对人脸特征点初始化对姿态变化敏感的问题,本文通过对不同人脸朝向的特征点分布趋势进行分析,提出一种基于人脸朝向分类的特征点初始化方法,对不同朝向的人脸采取不同的初始化策略。对于每一个待进行特征点检测的人脸图像,首先提取人脸图像的HOG(HistogramofOrientedGradient)特征,输入到已经训练好的随机森林决策树进行投票,得到其朝向分类标签。而后,不同的朝向选取对应训练子集中样本特征点的均值作为其初始化值。(2)对姿态变化不敏感的姿势索引特征的提取。为了增强多姿态变化下人脸特征点检测的鲁棒性,本文将传统的基于级联回归模型的人脸特征点框架拓展为正朝向、左朝向、右朝向三个方向,同时在对应的朝向下提出一种对姿势变化不敏感的特征——基于类内区域均值的姿势索引特征。首先,对人脸中关键部位的特征点进行聚类,随机取类内的特征点组成三角形区域模板集,接着在每个区域模板中选取若干个参考点,并计算其均值作为类内局部区域的输出,最后根据特征相关性分析得到局部区域特征对,作为姿势索引特征。本文提出的基于人脸朝向分类的特征点初始化方法,在不同朝向的姿势下取得很好的分类效果,在CAS-PEAL数据库和Helen-LFPW-300W混合数据库平均分类准确率分别达到95.8%、93.8%,同时得到的特征点平均定位误差要低于传统的随机初始化方法;基于类内区域均值的姿势索引特征,在Helen-LFPW-300W混合数据库中检测得到的人脸特征点平均定位误差要低于传统的姿势索引特征;同时将人脸特征点检测应用在眼睛定位上,得到的眼睛定位误差要低于传统统计学习的方法。实验结果证明,本文提出的初始化算法和姿势索引特征能较好的解决多姿态变化带来的问题。
其他文献
近年来,预制语块已成为二语习得领域的热门研究话题,基于语料库的预制语块研究逐渐增加。预制语块对于提升同声传译质量起着至关重要的作用。本领域相关研究主要关注英语教学
当今世界的竞争,归根到底可以说是人才和科技创新实力的竞争。而企业的研究与开发(R&D)活动作为科技创新的源泉,是企业培育核心竞争力和持续发展能力的关键所在。一个企业在
论文研究了一种基于ARM+FPGA的导航计算机,主要应用于MEMS惯导系统,其具有成本低,性价比高,体积小,应用范围广等特点。导航计算机设计中选用型号为EP3C25Q的FPGA负责数据采集
随着社会的不断发展,互联网在人们的生活中得到了更加广泛的应用,其已从简单的信息共享平台得到了飞速的发展,成为了一个巨大的关系网络,也就是是我们非常熟悉的社交网络。在
随着无线网络和智能终端的发展,人们对室内定位和导航的需求日益增大,因此面向室内定位的服务系统也受到越来越多的关注。基于不同传感器网络,各种各样的室内定位方法被提出,
进入21世纪的数据应用时代,城市在经济发展和社会文明等各方面都进入了飞速发展阶段,外来人口数量剧增,对城市公安部门的社会管理、案件侦破及可疑人员重点监管等工作提出了
随着无线网络普及程度的加深,各种无线终端设备要求网络具有高传输速率、高实时性等性能。物理层多输入多输出(Multiple-Input Multiple-Output,MIMO)技术的引入,使得无线网
随着计算机技术、网络技术以及电子信息技术在各行各业的日益发展,多处理器体系以及多核架构在计算机系统结构中应用得越来越频繁,其正确性、可靠性等问题也越来越突出。带参
低占空比无线传感器网络(Low-duty-cycle Wireless Sensor Networks,简称LDC-WSN)可部署在人类难以进入的恶劣环境中执行长期的监测和目标跟踪等任务,具有广泛的应用前景。在
随着计算机技术的快速发展,人机交互技术在当今社会的应用越来越广泛。而机器的智能化一方面就体现在对于用户情感的识别,其中生理信号在情感计算领域中的地位尤为突出。当前