论文部分内容阅读
语音处理系统都不可避免地要受到各种噪声的干扰。噪声不但降低了语音质量和语音可懂度,而且还将导致系统性能急剧恶化。为了消除噪声的干扰,语音处理系统广泛采用语音增强技术。因此,研究语音增强技术具有重要意义。 语音增强的主要目的有两个:一个是改进语音质量、消除背景噪声,使听者乐于接受、不感觉疲劳,这是一种主观度量;二是客观度量,以提高语音信噪比为目的。本文对语音增强方法的研究就是为在这两方面达到满意的结果所进行的一些探索研究。 本文借鉴已有的各种语音增强算法,对它们进行了探讨验证和一些改进,主要工作包括以下几个方面: 一、在语音信号端点检测部分,对基于倒谱距离的端点检测算法进行了改进,并提出了一种基于四种状态的判断机制,可以方便地用于有声无声检测。 二、研究了基于语音短时谱估计的语音增强方法,主要包括谱减法、维纳滤波法和基于语音短时谱MMSE估计的语音增强方法。论文介绍了上述语音增强方法的基本原理、实现方法,并对它们进行了改进,给出了实验结果和比较,揭示了这些方法之间的区别和联系。对谱减法的改进是根据帧频谱功率和频点范围来确定谱减系数;对维纳滤波法,尝试了两级维纳滤波和MCLT域变换;对MMSE方法,在传统对数MMSE算法的基础上引入频点的有音/无音概率、并对先验信噪比进行了改进,采用了新的增益函数,并提出了在MMSE算法后进行基本谱减后处理的构想,达到了在不损伤语音本身的前提下进一步抑制背景噪声、提高信噪比的目的,取得了较好的效果。 三、对在图像处理中应用普遍的形态滤波法用于语音信号处理进行了探讨,给出了实验结果和一些结论,该方法对正负脉冲噪声的处理效果很好。