论文部分内容阅读
人脸特征点定位是人脸应用中一个重要的环节,在人脸姿态矫正、姿态识别、表情识别、嘴型识别等领域具有重要作用。然而自然场景下拍摄的人脸图像往往受到光照、姿态、表情、遮挡以及图像分辨率低等非可控因素的影响,给人脸特征点定位带来巨大挑战。因此如何在自然场景下精确定位人脸特征点一直以来都是计算机视觉中的重点研究问题。本论文主要研究了自然场景下的人脸图像特征点的定位问题,基于深度学习模型,提出了一种通过使用堆叠的密集U型网络改进的边界感知人脸对齐方法。本文的主要工作和成果如下:(1)为了搭建基于热图回归的人脸特征点定位算法框架,本文探讨人脸特征点定位的相关基础知识。在特征提取方面,分析了不断改进的三种对称的U-Net网络结构,用以提取人脸图像各尺度的特征。在算法框架方面,研究了卷积神经网络的基础结构以及热图回归方法的实现机理。在人脸特征点定位数据集方面,总结整理了常用的公开数据集以及对比实验的评价指标等内容。(2)针对人脸对齐时的人脸几何信息表征问题,大部分方法直接采用离散的特征点作为人脸几何信息表征,本文基于人脸边界信息,提出一种改进的边界感知人脸特征点定位算法。算法的网络结构包括边界热图估计和人脸特征点回归两个阶段。在边界热图估计阶段,本文对人脸按照边界进行划分,获取的人脸边界信息能有效处理遮挡等情况,其中边界之间通过信息传递层来交换信息。在人脸特征点回归阶段,融合人脸边界热力图和原人脸图像,输入到堆叠的密集U-Net网络中,并用可变形卷积进行几何转换。最终的训练模型在300W、WFLW和COFW三个数据集上进行了实验分析,结果表明该算法具有较高的精确度,对较大姿态,夸张表情和遮挡严重的人脸图像具有鲁棒性。(3)针对模型训练时训练数据集有限的问题,本文使用了一种风格化的数据增强方法。风格化数据增强将人脸图像分解为光照,纹理和图像环境的风格样式空间,以及风格不变的人脸结构空间,利用风格化数据增强分离并重组人脸图像的风格空间和结构空间,通过风格转换来合成新的人脸图像。最终对WFLW,300W这两个基准数据集进行了风格化的数据增强,使用扩充后的数据集进行模型训练,最终边界感知特征点定位模型的训练结果在很大程度上优于原来的训练结果。