论文部分内容阅读
情感识别是情感计算中最为基础与核心问题之一。与面部表情、语音等外显生理指标相比,生理信号能够更加真实、客观的反应用户内心的体验,因此基于生理信号的情感识别受到研究者的广泛关注。以往基于生理信号的情感识别主要是基于生理信号在时域或频域上的统计特征,很少关注生理信号的非线性特性。为了进一步扩展前人的研究工作,本文主要考察了以生理信号的非线性特征为基础的情感识别任务。本人所开展的研究工作以及主要结论有:(1)针对获取情感生理信号较为困难的问题,采用了“回忆”的实验范式来诱发被试的情感,并采用BIOPAC MP150采集被试的皮肤电(GSR)和心率(HR)两路生理信号。该范式的特点是,通过“回忆”的方法采集被试对目标情感诱发效果的评价,获得被试对目标情感诱发与否以及诱发强度的内在情绪体验。通过e该实验采集了200人次的生理信号,最终提取的有效数据为:高兴96个,悲伤87个,愤怒36个,恐惧59个。(2)为了能够提取皮肤电和心率的非线性特征,首先需要确定这两路生理信号具有非线性特性。本文采用替代数据法生成各类情感生理信号时间序列的替代数据,采用时间反转不可逆量T1和高阶自相关函数T2作为统计检验的特征项,检验原始数据和替代数据是否差异显著。结果显示四种情感的GSR和HR信号均差异显著。由此证明皮肤电和心率信号具有非线性特性。(3)针对具有非线性特性的皮肤电和心率信号,采用多种非线性数据值分析方法提取情感生理信号的非线性特征。这些数据分析方法和提取特征分别是:相空间重构,采用C-C方法计算嵌入维和延迟时间,采用Wolf方法计算最大Lyapunov指数,采用GP算法计算关联维,采用改进的Lempel-Ziv复杂度计算方法计算一阶和二阶Lempel-Ziv复杂度,计算一阶和二阶近似熵,采用移动平均算法计算多重分形谱以及相应的谱特征,采用递归定量分析计算一系列关于递归图的特征,计算心率的庞加莱图以及相应的图特征。最后采用主成份分析(PCA)对以上提取的45组非线性特征进行了降维处理,最后得到10个主要特征用于后期分类。(4)针对最初采集的数据集不均衡的问题(高兴96个,悲伤87个,愤怒36个,恐惧59个),在经典模糊支持向量机FSVM的基础上,提出了针对非平衡数据集的模糊支持向量机的算法-——IBFSVM。该算法主要是将代价敏感的思想融入到隶属度函数的设计中,从而有效提高少数类的分类精度。通过在3个人工数据集和6个UCI数据集上的运行,比较了经典的SVM算法(C_SVM)、传统的模糊支持向量机(FSVM)和基于非平衡数据集的IBFSVM,结果显示在正负类样本相差不大的情况,IBFSVM的性能与C_SVM和FSVM相差不大,随着正负类不平衡比逐渐增加,IBFSVM算法的优越性逐渐体现出来。在不平衡比为为39.55的Abanole数据集,IBFSVM在少数类的识别率为78.25%,而C_SVM和FSVM分别为5.16%和5.79%。可见在少数类和多数类样本数量差异较大的情况下,IBFSVM能显著提高少数类的分类性能,从而提高数据集的整体分类性能。采用IBFSVM对四种情感进行分类,分别得至(?)g-mean值为:高兴97.33%,悲伤94.18%,恐惧87.9%,愤怒83.51%。(5)以IBFSVM算法为基础,比较传统的统计特征和非线性特征在识别性能上的差异。结果显示非线性特征获得了更好的识别精度。在高兴情绪的识别率上,统计特征是80%,非线性特征是97.33%;在悲伤情绪的识别率上,统计特征是77.41%,非线性特征是94.18%;在愤怒情绪的识别上,统计特征是78.76%,非线性特征是83.51%;在恐惧情绪的识别上,统计特征是80.1%,非线性特征是87.9%。