论文部分内容阅读
随着模式识别以及机器视觉的不断发展,人脸表情识别也逐渐成为一个热门的研究课题,它是通过对人脸面部表情进行特征提取与分类,判别人脸的表情,目前在人机交互、安全驾驶、智能监控以及案件侦测等领域,都有广泛的应用,具有重要的研究价值。传统的人脸表情识别方法识别精度低、泛化能力弱,但随着深度学习尤其是卷积神经网络的发展,人脸表情识别技术也得到了快速发展,识别精度大幅提高。本文研究了基于卷积神经网络的人脸表情识别方法,主要的研究工作如下:(1)通过手动采集及爬虫技术收集人脸面部表情数据集,然后对这些数据集进行预处理作为输入网络的数据,同时,介绍了经典的AlexNet网络的结构,特别是其每一层的参数,利用人脸表情图像来训练和测试AlexNet网络,测试的人脸表情识别的精度为74.91%。(2)分析了AlexNet网络的缺陷,以及针对经典的AlexNet网络训练和测试人脸表情图像的识别精度低的问题,本文对经典的AlexNet网络做了进一步的改进,主要包括三个部分:引入了多通道卷积、全局平均池化以及批量归一化。利用人脸表情图像来训练和测试改进之后的AlexNet网络,最终测试的数据集的精度为88.15%,相比于改进前的网络,精度提高了13.24%,说明了基于改进的AlexNet网络的人脸表情识别的性能有了大幅提高。(3)由于收集到的人脸表情图像是现实场景的表情图像,所以必定存在光照因素的影响,而LBP特征对光照变化不敏感,并且对光照变化具有很好的鲁棒性,所以引入了LBP特征。但经过LBP变换后的图像不宜直接送入网络中,论文将原始图像进行了LBP特征映射之后,再送入改进后的AlexNet网络,但是,LBP特征映射时会经过LBP编码,形成的非均匀模式的LBP会丢失一些有用的信息,为了得到更充分的特征信息,本文又将LBP特征映射与CNN结合进行了特征融合。本文利用了四种LBP特征映射,分别是经典的LBP特征映射、半径为1、5、10的圆形LBP特征映射,这四种LBP特征映射直接送入卷积神经网络中,其中,半径为5和10的圆形LBP特征映射的实验效果较好,精度分别为89.87%、90.08%。然后又对半径为5和10的LBP特征映射与CNN结合做了特征融合,实验结果表明,半径为10的LBP特征映射与CNN特征融合的人脸表情识别效果较好,精度达到93.15%,同时,在这几个实验中,它的收敛速度也是最快的。最后利用半径为10的LBP特征映射与CNN特征融合的方案对150张图片进行了测试,并对测试的正确图像张数进行了比较。