论文部分内容阅读
人脸对齐任务是人脸识别系统中非常重要的一部分,是解决许多人脸相关问题的基础,比如人脸三维重建,人脸认证。目前主流的方法是基于级联回归的思路,这些方法在手工提取的特征上训练回归器,来使得初始形状逐渐地逼近真实的形状。尽管人脸对齐方法的精度目前有了很大的提升,达到了实用的程度,在自然状态下的人脸对齐仍然面临着许多的挑战,人脸的姿态,表情的变化,遮挡等问题使得非受控环境下的人脸对齐非常困难。近年来,深度学习模型在许多计算机视觉的任务上都达到了最好的效果。深度模型在数据量很大的情况下能够很好地解决复杂场景的人脸识别问题。本论文基于深度学习模型,提出了一种新的解决人脸对齐方法,将人脸对齐任务分成两个阶段。第一个阶段是响应映射阶段,对于每个特征点,经过深度学习模型来预测出其对应的响应图。本论文改进了全卷积网络结构以得到更好的对齐效果。首先是定义了高斯分布的响应图以及KL散度的损失函数。其次是将最大化池化替换为卷积池化。第二个阶段是形状映射阶段,处理响应图得到人脸的形状。本论文观察到由于卷积神经网络没有显示地将点与点的位置关系考虑进去,因此得到的形状会存在噪声。因此,本论文探索了使用主成分分析和深度自编码器来进行降噪的模型,并且证实了深度自编码器的效果比主成分分析要好。本论文提出的方法在300W数据集上达到了 4.32%的平均错误率,超过了目前最好的方法(CFSS,5.76%)。