论文部分内容阅读
语音识别是一门内涵丰富、应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。当今语音识别在办公或商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号以及医疗和卫生等领域发挥重要的作用,并且极有可能成为下一代操作系统和应用程序的用户界面。 虽然语音识别己经取得巨大的成就,形成了隐马尔可夫模型、矢量量化、动态时间规正等有效技术,出现了一些比较成功的语音识别系统,但是面临实用化还是存在一些问题,例如:环境噪声对语音识别系统性能的影响一直以来很难克服,噪声使系统性能急剧下降。同时系统对环境依赖性强,在某种环境下建立的语音识别系统只能在这种环境下应用,而且全世界共有上千种语言,每种语言又有许多种方言,随着环境的改变系统性能也必然会下降。本文着眼于汉语语音识别系统实用中所面临的主要问题,以提高识别率和提高识别系统的抗噪鲁棒性能力为目的,研究汉语语音识别实用化理论和关键技术。论文主要研究工作如下: 本文首先对语音识别的基础知识做了详细的阐述,然后针对传统齐次隐马尔可夫模型的缺陷,在对齐次隐马尔可夫模型进行系统深入研究的基础上,本文提出一种基于非线性分段技术的非齐次隐马尔可夫模型,系统分析了该模型的建立方法,并结合自适应函数链神经网络将之应用与汉语语音识别。实验结果表明用此混合模型识别语音其识别效果要明显优于使用齐次隐马尔可夫模型,并且有很好的鲁棒性。最后针对噪声环境下的语音识别,本文提出了一种将连续概率密度隐马尔可夫模型(Continuous Density Hidden Markov Model,CDHMM)与模糊神经网络相结合而成的新型的语音识别模型。并分析和讨论了基于Fletcher-Allen规则的子带和在独立子带框架下的语音识别算法,提出了小波分析的独立子带连续概率密度隐马尔可夫模型,小波分析应用了正交小波变换算法,因此可以达到有效抑制噪声的目的,同时,大大降低了运算量,节省了训练时间。实验结果显示,在信噪比较低的情况下,小波分析的独立子带CDHMM与模糊神经网络模型同在语音中直接加入加性噪声训练出的CDHMM模型,CDHMM与神经网络模型相比,识别率均有明显的提高,抗噪性更好。