论文部分内容阅读
随着人机交互在各个领域中日益增长,人工智能的需求日益引起人们的关注,而在日常的交流和交互中,人脸表情的读取和识别起到了相当关键的作用,同时这也是人机交互的基础。在这个发展中的时代,人机交互的应用很广泛,例如在行车过程中对人疲劳驾驶的监控,或进行特殊的心理咨询等。在过去的研究中,人们使用深度学习网络、级联网络等方法构建网络来预测情绪,并取得了一系列理想的结果。本文从深度学习的思想出发,针对现有的人脸表情识别算法的缺点和不足,进行进一步探索和完善。本文的主要内容和研究成果如下:针对卷积神经网络训练过程需要大量数据的问题,引入尺度不变特征变换算法,该算法的独特之处在于不需要大量的数据集就可以提取出重要特征得到理想结果。从而提出了深度学习下融合不同模型的小样本表情识别算法。该算法的思想是将卷积神经网络模型和尺度不变特征变换模型融合,首先对单个卷积神经网络进行探索比较,选择出合适的卷积神经网络模型,然后采用尺度不变特征变换模型提取特征,最后将深度学习模型与尺度不变特征变换模型融合。该算法充分的利用了尺度不变特征变换的手工特征,同时融合了深度学习的自动特征,增加输入特征的多样化。为了进一步提高人脸表情识别的准确率,提出了一种方法,通过结合卷积神经网络学习的自动特征和视觉词袋模型的手工特征,从而提高人脸表情识别的识别率。首先,采用Visual Geometry Group13(VGG13)的卷积神经网络模型,获得卷积神经网络的自动特征。然后用视觉词袋模型提取手工特征。在融合这两种类型的特征之后,引入局部学习的方法,对于特征选择的要求较高,故采用余弦度量的方法,最后使用支持向量机分类器方法来预测每个图像的类标签。针对表情识别时,模型的参数和计算量较大的问题。通过引入深度可分离卷积,提出了基于深度可分离卷积的人脸表情识别算法。首先搭建深度可分离卷积网络,相比传统卷积可以很大程度上减少参数和计算量,其次将全连接层去掉,改用全局平均池化层代替,充分解决了由于全连接层参数骤然增加,导致的参数过多的过拟合问题等。该算法比类似的算法参数降低了将近二十倍。