论文部分内容阅读
麦克风接收的语音信号通常被各种噪声污染,因此需要语音增强技术来提取有用信号。麦克风阵列语音增强一直是信号处理领域的一个研究热点,广泛应用于语音识别、视频会议和手机通讯等领域。麦克风阵列不仅能利用语音信号的时域和频域,还能利用源的空间信息来抑制噪声。麦克风阵列语音增强技术包括波束形成和盲源分离等方法。本文主要研究基于盲源分离的语音增强,它是一种能够同时提取多个目标源并且不需要源的先验知识信号处理方法。目前解决语音信号盲源分离主要包括为独立成分分析和时频掩蔽两大类方法。这两大类方法在存在混响和背景噪声的环境下分离性能都不够理想,为此本文提出相应的改进方法。
时频掩蔽是一种基于语音信号稀疏特性,对特征向量自动聚类的盲源分离方法,该方法对混响和背景噪声很敏感。为减小源空间参数的估计误差,本文提出了基于特征向量加权聚类的时频掩蔽方法,该权重由先验信噪比决定。为减少信号失真、串音和背景噪声,本文采用迭代的盲波束形成器,并结合使用语音幅度谱估计和时频掩蔽。
频域独立成分分析是一种基于源独立性假设的盲源分离方法。为减小混响的影响,本文将用于解混响的多通道线性预测器作为盲源分离的前置滤波器。为减少独立成分分析迭代次数,本文用时频掩蔽和盲波束形成的结果对频域独立成分分析做初始化,该初始化方法还能避免次序不确定性问题。此外本文还提出一种新的基于语音信号稀疏性的盲源分离后处理方法:基于局部最小比例控制谱减法,比常规的时频掩蔽和维纳滤波等后处理方法能更有效的控制音乐噪声,减小信号失真,提升分离性能。
本文还给出在线麦克风阵列语音增强系统,包括多通道线性预测、时频掩蔽和频域独立成分分析等。为增加系统的跟踪性能,本文提出一种新的变步长的独立成分分析方法。
实验验证本文提出方法在混响和背景噪声环境下有效性,信号失真比,信号干扰比较传统方法均有大幅度提升,并且计算量大大降低。