论文部分内容阅读
情感智能作为人工智能的一个方面,对人的社会交往起着非常重要的作用。语音信号不仅传达文字符号信息,还包含了说话人的情感信息,从语音信号中提取情感信息已成为模式识别领域的一个新的研究热点。本课题从工程应用的角度出发,面向个人机器宠物,研究语音情感识别,使机器宠物能够识别和理解主人语音中的情绪,并能与主人进行简单的情感交互。本文主要完成了下面几个方面的工作:
结合机器宠物的用途,针对五种典型情绪(喜悦、悲伤、厌烦、生气和平静)建立了四个人(两男两女)的常用话语语音库,并对语音信号进行预处理以获得有效的语音信号。
分析语音信号并提取对情感有贡献的特征。本文主要基于时间构造、振幅构造、基频构造、共振峰构造进行了提取,同时,为避免维数过高带来的计算复杂度,特运用主元分析法(PCA)对得到的特征矢量进行降维处理,选择能够保留90%以上信息的特征参数主分量作为情感识别特征。本文还结合网络的结构特点,提出了特征自动筛选的思想,并取得了良好的效果。
设计网络结构,训练网络。采用集成神经网络结构以提高泛化能力,每种情绪单独训练为一个子网络,每个子网络都是一个三层的小波神经网络,由五个子网络共同构成最终的判决网络。
本文把小波神经网络应用于面向机器宠物的语音情感识别系统,小波神经网络结合了小波变换和神经网络的优点,具有较强的逼近和容错能力,已经有效地应用于信号处理、模式分类和故障诊断等领域。它可以看作是以小波函数为基础的一种函数连接型网络,也可以认为是径向基(RFB)网络的推广,在神经网络研究领域中具有重大潜力。本文研究了小波神经网络针对机器宠物之语音情感分类的效果,平均识别率可达到80%,对个别情绪甚至超过了90%。另外,利用BP神经网络和改进的QDF方法对同样的语音库进行识别,与小波神经网络的识别效果进行了比较分析。
最后,在Matlab环境下建立了智能机器宠物学习和识别的仿真系统。考虑到情感的表达会因时间的改变而发生变化,训练好的网络经过一段时间后,性能会有所下降,为克服这种缺陷,本文借鉴控制理论中的反馈控制思想,在软件系统的实现上留有再学习接口,可以将识别结果反馈到网络,以实现在线丰富知识库、更新网络的目的。