论文部分内容阅读
人脸表情识别是指利用计算机分析特定人的脸部表情变化,进而确定其内心的情绪,实现人机之间更自然更智能化的交互。在很多领域都有其潜在的应用价值,包括心理学研究、图像理合成脸部动画、视频检索、机器人技术、虚拟现实技术以及基于脸部表情的新型人机交互环境的研究和开发等。完整的表情识别系统一般包括人脸表情图像捕获、预处理、人脸检测与定位、人脸分割与归一化、人脸表情特征提取、人脸表情识别。本文着重研究了人脸表情特征提取、特征选择及表情分类等关键问题,并提出了一些改进的方法,同时进行了仿真实验。(1)表情图像的预处理方法是整个识别系统的最初步骤。本文提出了基于复杂度和模板匹配的方法对眼睛区域进行检测并定位,实验证明,该算法简单,计算量小,且无须事先确定人脸位置,即可快速准确地确定眼睛位置,从而为图像的剪切、缩放及灰度归一化等其他预处理奠定良好基础。(2)重点研究了基于二维Gabor小波的表情特征提取方法。由于Gabor小波变换系数向量具有减弱图像光照及位置的敏感性等优点,所以本文采用Gabor小波提取表情特征,并在五个尺度、六个方向上构造Gabor小波,对每幅图像用这30个Gabor函数进行滤波,得到的系数作为表情特征。实验证明,本文方法相对于传统的PCA算法或2D-PCA算法其识别率更加有效。针对Gabor系数的高维性,本文提出了采用二次降维方法,即第一次降维采用不规则采样法,第二次降维采用2D-PCA方法,通过子空间变换,提取最有代表性的特征,有效地消除了冗余。实验证明,本文方法明显降低了特征向量的维数,从而提高了识别速度。(3)分别采用最近邻分类器、欧式距离分类器、余弦距离分类器对生气、厌恶、恐惧、高兴、中性、悲伤和惊讶七种表情进行识别,并利用模糊积分对子分类器的识别结果进行融合。在信息融合中,改进了模糊密度函数,将各子分类器的不同表情的识别被赋以不同的密度,充分考虑了一个分类器对不同表情具有不同的识别率。实验结果表明,与基于平均识别率为模糊密度的识别方法相比,本文采用的基于混淆矩阵为模糊密度的识别率更高,证明这种改进是有效的。