论文部分内容阅读
情感和情绪在人类生活中起着很重要的作用,是自身生活和社会交往不可缺少的重要组成部分。随着现代科学的发展,对人工智能的要求也越来越高,对情感信息的处理已经成为人工智能发展的一个重要研究方向。本文主要研究了基于Boosting的情感语音识别问题。
本文首先对情感的定义和分类进行了介绍,然后对语音情感信息处理领域的现状和存在的问题进行了总结,了解了语音情感分析处理的研究进展和一些研究成果。
接着依次对语音信号的振幅构造,时间构造,基频构造和共振峰构造的特点和分布规律进行了分析。选取了振幅,发音持续时间,语速,浊音段时间与清音段时间比值,基音轨迹和共振峰轨迹等作为情感语音的特征参数。
在模式识别方面,本文首先介绍了Boosting和Hidden Markov Models(HMM)的典型算法,展示了情感语音识别的基本框架。然后具体介绍了利用改进后的Adaboost算法进行情感语音识别的方法。
Boosting方法是一种试图提升任意给定学习算法精度的普遍方法。其基本思想是通过粗糙的,不太正确的简单的初级预测方法按照一定规则最终得出一个精确度高的复杂的预测方法。因其具有适应性强,精度高的优点,已经广泛应用于模式识别的各个领域。Adaboost是Boosting家族的代表算法。本文对Adaboost算法中重要参数的修改,从而对Adaboost算法进行改进。本文不仅从理论上证明提出的改进后的Adaboost算法能够达到更高的准确率,并且用实验结果证明了改进后的算法能达到更高的准确率。
本文主要工作是利用改进后的Adaboost算法,结合HMM进行语音情感识别,对比其他的几种算法,该算法取得了较好的识别效果。