论文部分内容阅读
随着计算机技术的快速发展,计算机的智能化和人性化逐渐成为新的研究热点,其中语音作为人与计算机交流的最简单方式,成为其实现的关键因素,本文重点研究了计算机的情感语音识别。所做的工作有以下几点:首先论文介绍了常用的几种情感识别网络模型原理及优缺点,接下来将具有快速学习速度和良好泛化性能的极限学习机算法用于语音情感识别中,建立了基于极限学习机的广义单隐层前馈神经网络识别模型(基本极限学习机ELM和核函数极限学习机KELM),同时对比SVM识别模型,对TYUT和EMO-DB两情感语音库中的三种情感高兴、生气和中性的识别效果进行了分析。接着就核函数极限学习机KELM性能进一步分析,发现其参数对网络性能具有重要影响,从而提出了采用人工蜂群算法优化网络参数;针对基本人工蜂群算法寻优过程存在的种群多样性降低和收敛速度变慢的缺点,提出了改进的人工蜂群算法优化KELM参数,对EMO-DB情感语音库中的4种情感(高兴、生气、悲伤和中性)进行识别实验,结果表明改进人工蜂群算法优化KELM参数的识别模型在时间上和泛化性能上均是最优的。最后针对基本极限学习机网络不够稳定的问题,提出了选择性集成极限学习机模型,先建立Bagging极限学习机网络和out-of-bag样本;接着将每个基本ELM分类器对应的权重组成的权重向量作为人工蜂群算法的种群个体,适应度函数设为out-of-bag样本输入到具有不同权重向量的Bagging极限学习机网络中得到的泛化误差,通过蜂群算法寻优机制找到最优的权重向量,剔除对应权重值小于阈值的ELM分类器,对剩余的ELM分类器进行集成;对EMO-DB情感语音库中的4种情感(高兴、生气、悲伤和中性)进行识别实验,同时对比基本极限学习机ELM,多数投票极限学习机V-ELM,集成极限学习机Bagging-ELM模型,结果表明本文建立的选择性集成极限学习机网络模型,在稳定性和泛化性能上均优于其它三种网络模型。