论文部分内容阅读
目前的连续语音识别系统对纯净语音已能达到非常高的识别精度,但是无处不在的背景噪声带来了训练模型和测试语音之间的失配,这种失配使得连续语音识别系统的性能在噪声环境中急剧下降。因此抗噪声问题是语音识别的关键性问题。本论文首先分析并实现了一个以Mel频率倒谱系数(MFCC)作为语音特征,基于隐马尔可夫模型(HMM),针对连续数字串识别任务的基本连续语音识别系统。然后基于此基本连续语音识别系统进行了抗噪声技术的研究。目前的抗噪声技术主要分为四类:语音增强法、提取抗噪语音特征法、噪声补偿法、丢特征法。本论文分别对其中的语音增强法和基于丢特征法的条件概率联合模型方法进行了研究。其中通过对传统Wiener滤波算法和传统ANC算法的缺点进行分析,提出了改进型重复Wiener滤波算法和改进型CTRANC算法。实验表明我们提出的这两种方法相比传统方法有更好的噪声抑制效果。再者我们通过对条件概率联合模型的优缺点进行研究后,我们提出了后验概率联合模型PUM,提高了对时变噪声的消噪效果。最终本文提出了语音增强结合PUM模型的一种新的语音抗噪方法,并且基于这种新方法我们从高识别率和低成本较高识别率两方面出发,构建了改进型CTRANC结合PUM新模型和改进型重复Wiener滤波结合PUM新模型。这两个新模型分别用改进型CTRANC和改进型重复Wiener滤波语音增强方法对含噪语音中有先验知识的噪声进行滤除,较有效的消除了宽带噪声。从而为PUM模型提供了只有局部频带被噪声污染的语音信号,弥补了PUM模型不适用于语音信号全频带被噪声污染的情况。同时这两个新模型利用PUM模型作为语音增强的后处理,有效的消除了语音增强造成得语音失真,也正弥补了语音增强方法的缺点。实验结果表明,这两个新模型相比其它模型在各种不同背景噪声情况下有更好的语音识别率,其中改进型重复Wiener滤波结合PUM新模型提高近15%的字语音识别率,改进型CTRANC结合PUM新模型提高近30%的字语音识别率。