论文部分内容阅读
人脸特征点定位是人脸识别和分析研究领域中的重中之重,它是诸如自动人脸识别、表情分析、三维人脸重建及三维动画等其它人脸相关问题的前提和突破口。近些年来,深度学习方法由于其自动学习及持续学习能力,已被成功应用到了图像识别与分析、语音识别和自然语言处理等很多领域,且在这些方面都带来了很显著的改善。因此,本文利用深度学习方法进行了人脸特征点定位的研究。在传统的研究过程中,人们一般都是将人脸检测和人脸特征点定位当作两个独立的课题。但事实上,人脸检测和人脸特征点定位工作是紧密联系并且互相影响着的。其中,人脸检测是人脸特征点定位的前提和基础,在目标人脸图像中准确地检测出人脸区域既可以保证人脸特征点定位的准确性,又可以缩小搜索范围,从而提高定位的效率。因此,本文考虑结合人脸检测来提高人脸特征点定位的精度。第一种结合方式是人脸检测卷积神经网络与人脸特征点定位卷积神经网络前后相级联,以充分发挥人脸检测对人脸特征点定位的基础作用;第二种结合方式是多任务学习。将人脸检测和人脸特征点定位看作互相关联的两种任务,利用多任务学习的思想,用一个深度卷积神经网络模型同时学习这两种任务,从而让两个任务之间可以互相促进、互相提高。基于此,本文的主要研究内容和创新点是:(1)设计了基于选择性搜索策略和改进的Alexnet卷积神经网络的人脸检测器。本文在人脸检测问题上选用的也是深度学习方法和卷积神经网络模型。这是因为,通过传统人脸检测算法(比如最经典的Adaboost算法)裁剪出来的人脸矩形框,经常会掺杂很多冗余的背景,且定位到的人脸,有时并不能够准确在矩形的中心,而使用卷积神经网络可以明显改善这些问题,从而能更好地进行人脸特征点定位。(2)提出了基于级联卷积神经网络的人脸特征点定位方法。第一级是(1)中提到的人脸检测器,第二、三级分别是用于人脸特征点粗定位和细定位的两层卷积神经网络,文中详细探讨了这两层卷积神经网络的网络结构及参数设置。(3)提出了基于多任务深度学习的人脸特征点定位算法。设计了两个多任务深度学习模型:在卷积神经网络的中间层融合人脸检测和人脸特征点定位两个子任务的深度学习模型以及在卷积神经网络的全连接层融合这两个任务的深度学习模型。本文设置了多组对照实验,实验基于Caffe深度学习框架和Python编程而进行。实验结果证明,上述两种方法得到的人脸特征点定位效果,相对目前比较好的方法,在精度上都有很大提升。