论文部分内容阅读
耳语音是人们在公共场合常使用的一种交流方式。由于发耳语音时的呼吸噪声、背景噪声以及环境噪声,进行耳语音处理时对含噪耳语音的去噪及增强就显得极为重要。
目前,耳语音方面的研究很少,很多都是对耳语音的基本特性的分析,在耳语音增强方面就更少,大多都采用基于短时幅度谱估计的算法进行耳语音增强,其残留的背景噪声和音乐噪声较大,会给听觉质量带来影响。因此本文从噪声和先验信噪比估计,增益(加权规则)和耳语音的感知特性等方面对耳语音增强进行了研究,主要研究内容如下:
针对基于Fourier变换的周期图法的谱估计偏差和方差较大,导致残留音乐噪声的问题,本文利用小波阈值多窗谱功率谱估计法方差小的特点,对噪声以及含噪耳语音与噪声之比进行估计,实现先验信噪比的平滑,进而采用端点检测对噪声进行跟踪,使得估计的噪声谱更接近真实谱。最后利用改进的功率谱减法得到增强耳语音。实验结果表明,该算法使得降噪后的耳语音有较小的语音失真,且有效地抑制了音乐噪声。
基于最小均方误差准则推导了Wiener滤波的参数形式,并结合耳语音声级低,信噪比低的特性,进一步提出了改进的参数Wiener滤波法。
基于最小量控制递归平均算法,从含噪语音的多窗谱估计噪声和先验信噪比,并根据多窗谱方差小的特点对估计算法的参数作了调整。最终的增强耳语音通过改进先验信噪比估计增强算法获得。主客观评价指标表明:高斯白噪声下,多窗谱和改进先验信噪比估计的结合能使增强耳语音的质量得到较大的改善,几乎不存在音乐噪声。
由于人耳对耳语音具有特殊的处理方式,本文采用了听觉掩蔽模型与符合耳语音感知特性的WSS(whispered sensitive scale)相结合的处理方法进行耳语音增强。首先根据耳语音的WSS感知特性,对传统的临界频带划分进行修正,以适应人耳的敏感频段从耳语音的第一共振峰移到第二共振峰的特点,然后基于修正的临界频带计算听觉掩蔽阈值,对不同的听觉掩蔽阈值动态地调节谱减系数来进行耳语音增强。其中,用于计算掩蔽阈值的预增强耳语音是用基于多窗谱的改进功率谱减实现的,因此掩蔽偏移量也根据多窗谱方差小的特点做了调整。实验结果表明与其他谱减方法相比,该方法在提高信噪比、抑制背景噪声、减少语音失真等方面得到了改进。