论文部分内容阅读
近年来,人脸表情识别在人机交互、情感分析、精神医学等领域有着广泛应用。目前的表情识别研究中,大部分对静态表情识别展开研究,但静态表情识别很大的一个局限在于静态图像往往只能捕获表情最饱满时的信息,而在日常生活中,表情是一个动态的过程,人们在普通交流过程中很少展现最饱满的表情。因此,对动态表情识别的研究有非常大的理论意义和实践价值。虽然许多研究者在动态表情识别上也取得了一定成果,但大部分识别率不高且不具备实用性,为了提高识别率,本论文围绕动态表情识别的三个步骤,即人脸检测定位、表情特征提取和人脸表情分类展开了研究。对于人脸检测与关键部位定位,本文采用了基于Haar-like特征的AdaBoost算法,然后在检测到的人脸和关键部位区域上,采用改进的ASM模型进行表情特征点定位;对于表情特征提取,本文根据已定位的面部表情特征点,提取表情序列的几何特征和纹理特征,然后将这两种特征融合组成最终的表情序列特征即混合特征;对于表情分类,本文采用自回归模型建立分类器,并提出了一种有效的相似度度量方法进行决策。本文研究工作的贡献与创新之处主要呈现在以下几个方面:(1) 在对表情特征点定位时,引入随机森林算法进行特征点初始化,使ASM模型对人类特征点的定位更加精准和高效;(2) 在对表情序列提取特征时,采用基于序列的混合特征,该特征包含丰富的表情变化信息。混合特征由几何特征和纹理特征组成,其中序列的几何特征由归一化后一个完整的表情序列中带有表情变化的帧与初始帧在对应表情特征点上的位移差组合而成,序列的纹理特征由归一化后每一个表情变化帧与初始帧上对应特征点纹理区域的归一化互相关系数组合而成;(3) 在对表情分类时,采用二阶自回归模型建立分类器,在分类决策过程中,为了使分类更具区分能力,提出了一种新的基于线段的相似度度量方法。本文在Extended Cohn-Kanade(CK+)表情库上对算法展开实验,先是基于同一个分类算法上,实验证明基于混合特征的识别率高于单一特征,然后通过对比实验,验证本文提出的基于线段的相似度度量方式的有效性,并且将本文提出的整个识别算法与其他研究者的表情识别算法进行对比,证明了本文算法的优越性。