基于高阶统计量的语音激活检测算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:songlyan182320697
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信技术的飞速发展,人们对通信中语音质量的要求越来越高,语音信号处理技术已经成为语音通信技术等领域中一个重要的组成部分,而语音激活检测技术是许多语音处理系统中之至关重要的一步。尽管语音激活检测技术在安静的环境中已经达到令人满意的准确率,但在现实环境中由于各种不同噪声的引入使得语音激活检测的性能显著下降。针对这种情况,本文提出了两种有效的解决办法。   本文首先总结了语音信号和噪声信号的特点以及语音信号处理的基本方法。分析了语音激活检测的基本原理、几种经典的语音激活检测方法以及语音激活检测的评价标准。其次,提出了两种语音激活检测的新方法,它们分别是基于高阶累积量的语音激活检测算法和基于高阶谱的语音激活检测算法。并对两种算法的性能进行了详细的测试。实验结果表明,这两种语音激活检测算法在多种噪声条件和不同信噪比下都具有较高的准确率和稳定性,是两种有效的语音激活检测算法,且在一定程度上都优于G.729 Annex B中的VAD算法。再次,对本文提出的两种算法进行了对比,其中第一种方法不仅有较高的激活检测准确率,而且非常简单;第二种方法比第一种方法鲁棒性更强,只是较第一种算法更为复杂。   最后,文章对本文给出的两种新方法进行了总结,指出了今后研究中需要改进的问题。
其他文献
随着宽带无线通信技术的发展,移动通信用户对高速移动数据业务及多媒体业务的需求越来越迫切,多载波调制技术应运而生。小波包调制(WPM)作为一种新型的多载波调制技术,由于具
无损检测是工业发展必不可少的有效工具,随着无损检测技术应用与推广,其中振动信号分析法是当前应用最广泛的技术之一,可以用于机械设备故障检测、电子对抗、图像处理等许多领域
三维逆合成孔径雷达(ISAR)成像是当前雷达成像领域较为前沿的热门课题,在干涉测高、形变检测、目标识别等领域均有广阔的应用前景。但传统三维ISAR成像通常面临采样率高、观测
预编码技术就是在发射端根据已知的信道状态信息,设计一种预处理操作来去除接收信号中天线之间或用户之间的干扰,以及做自适应的处理来提升系统的性能。这样做的好处是一方面
近年来,MIMO技术在超宽带系统中的应用已经成为研究与开发的热点。它能够大大提高超宽带系统的容量,但如何利用这些潜在的容量是目前亟待解决的问题。信道编码技术就是其主要研
随着经济水平的提高,健康已成为现代社会主题之一。医学影像技术使我们可以非侵入地观察人体内部构造和诊断治疗。而医学图像处理和分析作为信息科学技术和医学的交叉学科,将
"火像茶叶一样.好茶生长在岩崖间,经历大自然滋润的同时,要经受各种考验,风吹、雨打,甚至冰霜.茶在很嫩时,就被采摘下来,脱离母体,经过炒,揉,几乎烘干自身水分,之后,大部分茶
现在无线通信技术发展非常迅速,然而在实际的无线通信系统中存在着各种各样的干扰。如果对存在的干扰不做任何处理,整个通信系统有可能无法正常工作。因此如何有效地抑制干扰
2008年6月25日,由国家体育总局训练局、中国烹饪协会西餐专业委员会和亨氏公司联合主办的“亨氏冠军西餐,引领健康美味”主题活动发布会暨体育概念创意菜肴征集活动颁奖典礼
无源雷达不仅具有可用外辐射源信号资源丰富、隐蔽和对敌隐身的特点,还能有效地解决地物干扰和低空目标探测等难题,有广阔的应用前景。在梳理和总结无源雷达技术的基础上,对