论文部分内容阅读
目前大多数语音识别系统在静音环境下具有较高的识别率,但在噪声环境下,系统的性能会严重下降,为了使语音识别系统实用化,抗噪语音识别研究具有重要意义。 人耳具有很强的识别能力,即使在噪声环境下也如此。因此研究人耳的听觉特性,进行语音特征参数的提取,有利于提高系统的鲁棒性。 本文围绕抗噪语音识别这个中心,完成了以下研究工作。 首先实现了具有过零峰值幅度(ZCPA:Zero-crossing with Peak Amplitude)特征的语音识别系统,它是基于人耳的听觉模型建立起来的。该模型通过分析和计算语音信号相邻上升过零点间的间隔,并将之分配到对应的频率箱,以此反映信号的频率信息;再通过检测相邻上升过零点间的峰值幅度并进行非线性压缩,对频率箱幅度进行加权。论文分析了该系统的抗噪性能,通过实验证明了这种系统的抗噪性能优于常用的由LPCC,MFCC作为识别特征的系统性能。 接着,论文以上述系统为基础,提出了改进ZCPA特征,