论文部分内容阅读
变速率语音编码技术在陆地蜂窝移动通信、卫星移动通信、VoIP等数字通信系统中有着广泛的应用前景,而语音激活检测(Voice Activity Detection,VAD)算法是实现变速率语音编码的关键技术之一。采用VAD算法实现的变速率声码器能在合成语音质量和带宽资源之间取得灵活的折衷,因此,研究出稳健、可靠的VAD算法,尤其是在噪声环境下,对变速率语音编码技术的发展具有重要的意义。目前,语音激活检测方面已有不少的研究成果,其中,基于隐马尔科夫模型(Hidden Markov Model,HMM)的VAD算法能够较好地区分话音信号和背景噪声信号,是目前数字语音信号处理重点研究课题。本文从课题的研究背景与现状入手,简要阐述了VAD算法的基本原理和噪声特性,介绍了自适应多速率编码(Adaptive Multi-Rate,AMR)标准中和G.729B编码标准中的VAD算法的实现过程,并分析其优缺点。然后重点研究了基于HMM模型的VAD算法并进行改进。最后将其应用到了低速率声码器中,实现了一种可变速率的声码器。具体工作如下:1.为了改善现有基于HMM模型VAD算法对噪声的跟踪性能,本文采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应的噪声模型,建立了噪声模型库。在检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型。同时,本文对阈值计算方法进行改进,提高算法判决准确率。实验结果表明,本文算法具有较高的检测准确率及较好的噪声跟踪能力。2.将改进后的VAD算法通过非连续传输技术应用到4kb/s混合激励线性预测(Mixed Excitation Linear Prediction,MELP)声码器中。编码器端对VAD判决出的话音帧采用全速率编码,而对判决出的背景噪声帧采用较低速率编码或者不编码,从而实现了一种可变速率声码器。性能测试结果表明,本文实现的可变速率声码器在保证合成语音语音质量情况下,平均编码速率大幅度降低,说明了本文VAD算法在实时语音中具有良好的实用性。