论文部分内容阅读
语音是人们进行信息传递不可或缺的方式,然而繁杂的噪声却严重污染着语音信号。因此如何有效地消除带噪语音信号的噪声,对提高语音质量至关重要。麦克风阵列语音增强算法具有较好的空间选择性与抗干扰能力,能够增强指定方向目标语音,有效滤除环境噪声。但该算法对非相干噪声的抑制十分有限,并且增强时保持带噪语音的相位不变,滤波后仍残留部分噪声分量。因此本文针对传统麦克风阵列语音增强的局限性,提出一种基于频谱补偿的麦克风阵列语音增强算法。本文的主要工作内容如下:一、介绍了麦克风语音信号模型理论、研究背景与意义、国内外研究发展历史与现状、阵列信号处理模型、语音信号基本特征、基本语音增强技术。二、本文针对传统的自适应波束形成对非相干噪声抑制不足的问题,提出一种改进的基于最小方差无失真响应的后置滤波(AW-MVDR)语音增强算法。该算法使用最小均方误差准则来自适应更新后置滤波器的加权因子,从而确定最优的频谱增益函数,并设计子带滤波器进一步提升滤波的精度。实验表明,在高斯白噪声条件下,该算法PESQ得分比MVDR平均提高了0.296分,提高了12.1%,有效地改善了语音去噪效果。三、本文针对传统的自适应波束形成保持带噪语音相位谱信息不变的问题,提出一种基于信噪比依赖的相位谱补偿(S-PSC)语音增强算法,根据每帧输入语音信噪比修正相位谱补偿函数。由于噪声估计准确性对相位谱补偿性能影响较大,因此本文提出一种基于语音存在概率的改进时间递归平均算法对噪声功率进行估计,进一步提升相位谱补偿的性能。实验表明,在高斯白噪声条件下,本文S-PSC算法PESQ得分比传统相位谱补偿平均提高了0.143分,提高了7.9%,获得了更好的语音增强性能。四、本文结合幅度与相位联合补偿的优势,提出一种基于频谱补偿的麦克风阵列语音增强算法。该算法首先使用AW-MVDR后置滤波估计纯净语音的幅度谱,联合S-PSC算法对相位谱进行补偿,实时重构目标语音信号的频谱信息。实验结果表示,在高斯白噪声条件下,该算法PESQ得分比传统MVDR平均提高了0.422分,提高了17.3%。由此可见本文算法能够有效地抑制噪声分量,输出语音质量明显提高。