论文部分内容阅读
现代语音通信系统往往无法工作在理想环境下,相反其使用过程中总是伴有噪声的干扰。语音增强算法能在某种程度上减轻或者抑制背景噪声,它是使工作在非理想环境中的通信系统获得较满意结果的重要手段。所以在语音应用多样化的今天,展开对语音增强技术的研究工作有着重要的现实意义。语音增强的目标主要有两个,一是以提高语音质量为目的,另一个是要提高语音可懂度。语音增强算法的目标与具体的应用相关,理想情况下希望语音增强算法既能够改善语音质量,又能提高可懂度。而实际上,大多数算法在减少背景噪声的同时,会引入语音的失真进而损伤了语音的可懂度。因此,语音增强的一个主要挑战就是设计一个高效的算法,在不明显引入信号失真的前提的下,能够对带噪语音中的噪声进行有效的抑制。基于信号子空间的语音增强方法是利用线性代数和矩阵分析的一门降噪技术,其主要的思想是将带噪语音信号向量投影到信号子空间和噪声子空间这两个正交子空间中,通过消除映射到噪声子空间的向量成份便可以得到估计的纯净语音信号。该算法的优点是一般不仅不会引入像频域降噪方法中一样的音乐噪声,而且语音失真程度和残留噪声程度是可折衷调节的,能够达到使残余噪声低于一定的程度的并且最小化语音失真。相对其他方法类,近年关于信号子空间语音降噪技术的研究不多,且主要是理论研究和性能分析方面,甚少有针对实用系统实现的研究。本文从信号子空间方法的基本模型出发,对子空间降噪方法的基本原理和常用估计器的方法进行了较系统的分析,并重点针对子空间降噪算法的关键环节,如协方差的估计方法、影响降噪效果的朗格朗日参数选择方法进行了分析。在以上基础上提出了一种使用稳态窗共享协方差估计方法,以及一种基于后验信噪比的拉格朗日参数自适应调整方法。改进的协方差估计方法很好的提升了子空间降噪算法的计算效率,一定程度上解决了子空间降噪算法高复杂度的问题。而拉格朗日参数的选择方法使得在带噪语音的不同区间使用不同的降噪强度,在语音主导段减小降噪程度,最小化语音失真;而在噪声主导段最大化降噪程度从而保持较少的残留噪声。同时论文也引入了解决有色噪声的处理方法使得算法可以用在实际的通信系统当中,在综合这些改进方法之上,对算法进行仿真对比,实验验证了改进后的子空间算法在提高计算速度的基础上保持良好的降噪效果,并且由于其固有优点当将算法应用到语音识别系统当中的时候产生了较好的预处理效果,提高了语音识别系统的识别精度。最后,本文实现了一个基于该应用背景开发的在线语音识别软件系统,并展示了本文中算法在实际系统中应用的效果。