论文部分内容阅读
目前,汉语连续语音识别在纯净语音环境下,已经取得了较好的识别效果。但在自然环境下,由于各种噪声的影响,识别率依然很低,还不能满足实际场合的应用要求。因此带噪环境的连续语音识别一直是当前语音信号研究的热点和难点。HMM模型是连续语音识别中应用最广泛的模型之一,但模型的训练往往是在安静的实验室环境下完成的,因此训练模型无法有效描述自然环境下实际语音信号的特点。噪音干扰使端点检测的准确性也大为降低,系统识别率也随之下降。除此之外,汉语连续语音识别中识别基元的选取,模型的上下文相关,都对识别率有较大的影响。为了提高带噪环境下语音识别系统的性能,本文根据连续语音识别的基本原理,针对带噪环境的特点,对语音识别算法进行了一些研究,具体工作如下:(1)研究了一种改进的基于谱减的语音增强算法,该算法解决了基本谱减法的“音乐噪声“问题;采用基于自适应子带谱熵的端点检测算法,并将它与改进的谱减语音增强相结合,进一步提高了带噪环境下语音端点检测的准确率。(2)介绍了一些常用语音特征的提取算法如反映人类声道信息的LPCC,具有抗噪性能的MFCC;提出了一种基于线性预测与归一化互相关的基音特征提取算法,该算法提高了带噪环境基音检测的性能。(3)讨论了HMM模型的基本原理,并对HMM的三个基本问题前--后向算法,Viterbi算法,Baum-Weich算法做了详细介绍;同时对HMM应用中的HMM初始模型选取、溢出问题以及模型的合并也做了深入的探究。(4)针对汉语连续语音识别系统中声学模型的训练,发音协同等问题,对声学模型中识别基元选取、声学模型的嵌入式训练以及上下文相关的三音素模型等做了进一步的研究;最后,采用HTK工具箱进行了一系列的实验分析。