噪声环境下的语音激活检测算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:long5139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变速率语音编码技术在陆地蜂窝移动通信、卫星移动通信、VoIP等数字通信系统中有着广泛的应用前景,而语音激活检测(Voice Activity Detection,VAD)算法是实现变速率语音编码的关键技术之一。采用VAD算法实现的变速率声码器能在合成语音质量和带宽资源之间取得灵活的折衷,因此,研究出稳健、可靠的VAD算法,尤其是在噪声环境下,对变速率语音编码技术的发展具有重要的意义。目前,语音激活检测方面已有不少的研究成果,其中,基于隐马尔科夫模型(Hidden Markov Model,HMM)的VAD算法能够较好地区分话音信号和背景噪声信号,是目前数字语音信号处理重点研究课题。本文从课题的研究背景与现状入手,简要阐述了VAD算法的基本原理和噪声特性,介绍了自适应多速率编码(Adaptive Multi-Rate,AMR)标准中和G.729B编码标准中的VAD算法的实现过程,并分析其优缺点。然后重点研究了基于HMM模型的VAD算法并进行改进。最后将其应用到了低速率声码器中,实现了一种可变速率的声码器。具体工作如下:1.为了改善现有基于HMM模型VAD算法对噪声的跟踪性能,本文采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应的噪声模型,建立了噪声模型库。在检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型。同时,本文对阈值计算方法进行改进,提高算法判决准确率。实验结果表明,本文算法具有较高的检测准确率及较好的噪声跟踪能力。2.将改进后的VAD算法通过非连续传输技术应用到4kb/s混合激励线性预测(Mixed Excitation Linear Prediction,MELP)声码器中。编码器端对VAD判决出的话音帧采用全速率编码,而对判决出的背景噪声帧采用较低速率编码或者不编码,从而实现了一种可变速率声码器。性能测试结果表明,本文实现的可变速率声码器在保证合成语音语音质量情况下,平均编码速率大幅度降低,说明了本文VAD算法在实时语音中具有良好的实用性。
其他文献
目的探讨胺碘酮治疗老年室性心律失常的临床治疗效果。方法选择笔者所在医院2008年6月至2010年6月室性心律失常老年患者82例,将以上患者随机分为两组,即观察组和对照组。两组患
为了研究河南省新乡市区附近猪场饲料和粪便中重金属元素的含量以判定粪便能否直接被利用,试验从猪场随机抽取各生长时期饲料及对应粪便样品20个,测定重金属锌(Zn)、锰(Mn)、
本文研究无钠灯情况下,根据火焰发射原理,用原子吸收分光光度计测定Na的含量。工作曲线相关系数r2为0.9933。该法灵敏度高,选择性好,操作简便,工作曲线稳定,用本法测定Na的含
摘要:不孕为妇科疑难病之一。据调查,育龄女性中,不孕症的发生率约占15%~20%,其中约50%~60%是由于输卵管因素所致。针对输卵管性堵塞和炎性病变导致不孕,多数医院和医生都采用手术的方式
阳花普照,在冀南古城邢台的田间地头,一片片绿油油的秧苗点缀起一派春意盎然的勃勃生机.在这片田野里,除了躬身劳作的农人,还有一个个身影忙碌着,他们是走进田野的质监人.在
企业转型是全球经济一体化的必然要求。处于转型期的企业具有技术创新投入不足、管理意识低下、组织结构不完善以及品牌意识不强等问题。企业管理主要体现在人力资源管理和业
目的探讨护理质量的标准。方法对医院护理质量标准进行论述。结论质量是医院管理的核心,是在市场竞争中立于不败之地的关键。护理部担负着管理医院护理工作的重任,对护理质量实
基于制造业上市公司2000~2011年的财务数据,利用动态面板GMM方法,研究分析了环境动态性对营运资本管理效率和流动性与产品市场竞争关系的调节作用。实证结果表明:动态环境下