论文部分内容阅读
人脸识别作为一种重要的生物特征识别技术,在刑侦、金融、企业管理、智能交通等众多领域都有着广泛的应用前景。但要把人脸识别技术真正运用到实际中,还有诸多问题需要解决。例如,人脸特征点的精确定位,姿态变化、低分辨率和部分遮挡等条件下的人脸识别问题等。近年来,随着深度学习方向的研究不断深入,其在人脸识别领域也得到了广泛运用,在众多公开数据集上取得了突破性的研究成果。由于它强大的表达能力,能够拟合各种非线性函数,因此对于解决上述问题有着极大的优势。本文正是在此背景下,分别对现有深度学习在人脸特征点定位、人脸识别上的算法做深入分析与总结,并提出了基于多任务学习(multi-task learning)深度卷积网络的人脸特征点定位算法以及基于多模态表示(multimodal representation)深度卷积网络的人脸识别算法,分别在实验数据集上获得了良好的性能表现。在人脸特征点定位方面,近两年来比较流行的方法多采用级联的深度模型作为基本框架,如CFCNN[67]和CFAN[68]网络。然而,这种级联(cascade)结构会使模型的训练和预测效率降低,且并未考虑对人脸姿态变化的鲁棒性。本文提出的基于多任务学习的深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)将人脸特征点定位问题作为主要任务,头部姿态检测任务作为辅助任务,对两者用深度卷积神经网络联合学习,从而获得人脸特征点定位对于头部姿态的鲁棒性,最终在AFLW[70]数据集上达到了与级联结构相匹配甚至更高的特征点定位精度,以及更短的预测时间。在人脸识别方面,近年来DeepID[72]、FaceNet[13]等基于DCNN的模型取得了非常好的人脸识别效果,但仍然是人脸的单一模态表示,很难对抗姿态的变化。本文提出的基于多模态表示的深度卷积网络主要有两点改进:其一是用多个并行的深度卷积网络分别提取全局、局部以及姿态恢复后的人脸图像特征,从而能够得到对姿态、部分遮挡等具有不变性的特征。其二是将堆叠自动编码器(Stacked Auto-encoders,SAE)代替传统主成分分析(Principal Component Analysis,PCA)方法运用于特征的降维,以获得更具非线性的特征变换。在LFW[13]和CASIA-WebFace[80]数据集上分别评测模型的人脸认证准确率与人脸辨识准确率,均优于常规的DCNN模型。