论文部分内容阅读
语音增强技术是进行一系列语音信号处理中的基本问题,是语音处理系统里的核心技术之一。近年来,麦克风阵列语音增强方法由于融合了语音信号空时信息,能够获得较单通道更好的增强效果,因此逐渐成为研究的热点。然而,它们往往尺寸太大无法用于移动设备,因此对于小尺寸的麦克风阵列提出了需求。 声学矢量传感器(Acoustic Vector Sensor,AVS)是一种特殊的麦克风阵列,它体积很小,并且可以获得声波方向信息,能够很好的用于移动设备中。本文采用声学矢量传感器进行了语音增强方法的研究,主要内容包括: 1)基于波束形成技术和后置维纳滤波技术的语音增强算法研究:在深入分析波束形成技术和维纳滤波技术的基础上,提出了联合自适应波束形成和后置维纳滤波的方法和基于阻塞矩阵的维纳滤波方法; 2)面向目标语音增强的时频掩膜设计方法研究:针对自适应波束形成和维纳滤波算法难以应对声源数目多于传感器数目、对目标语音角度失配敏感以及维纳滤波器系数求解易受语音端点检测算法影响的问题,在深入分析语音信号时频稀疏性特性和声学矢量传感器间数据关系的基础上,提出了面向目标语音增强的时频掩膜设计方法。该方法对空间声源个数没有要求,对干扰声源类型也无要求,不依赖于语音端点检测算法,同时允许较大的目标语音角度失配,仅仅要求的是声源时频稀疏性的假设。仿真结果证明了该设计方法的能够有效提取目标语音且鲁棒性好; 3)基于时频掩膜的新型的语音增强方法研究:结合时频掩膜的思想,改进了现有AVS自适应波束形成方法,提出了基于精确噪声协方差矩阵估计的自适应波束形成方法;再结合波束形成和维纳滤波的思想,提出了几种新型的语音增强方法。仿真和实测实验结果证明了所提出的语音增强方法能够有效抑制非目标方向的干扰声源以及背景噪声。