论文部分内容阅读
语音识别的最终目标是实现人与机器之间进行自然语言的通信,它涉及到生理学、语言学、计算机科学以及信号处理等诸多领域。在语音识别的实际应用中,噪声一直是制约该技术广泛应用的主要问题之一。因此,本课题所确定的研究目标是提高噪声环境下语音识别的性能。
语音识别是一个复杂的非线性过程,利用传统的基于线性系统理论的方法如隐马尔可夫(HMM)模型法来研究语音识别是有一定局限性的。另一方面,随着人工神经网络(ANN)研究与应用的逐渐深入,基于ANN的语音识别方法,逐渐成为人们关注的焦点并获得了良好的应用。因此,本文利用神经网络实现了语音识别系统的建立。
本文首先介绍了语音识别的基本概念、背景噪声对语音识别的影响以及语音识别过程中的预处理、特征提取及识别算法等各个环节的常规方法,然后,重点阐述了本课题所研究的两个方面内容:其一,在前端的特征提取阶段,通过深入地了解目前与人类听力相关的生理及心理的种种研究成果,给出了一种新的抗噪特征提取方法,即小波与谱压缩相结合的方法;其二,在后端的识别器设计阶段,提出了一种改进的粒子群算法(IPSO),并将该算法成功地用到了所设计的神经网络模型的参数学习中,建立了比较高效的基于改进的BP神经网络(IPSO-BP)及改进的量子神经网络(IPSO-QNN)的语音识别系统。通过MATLAB软件建立实验平台,对常规的识别方法与新的识别方法的识别性能与应用特点进行了比较、验证,仿真实验证明新算法的识别效果良好。