论文部分内容阅读
生活中以语音为主要交互方式的电子产品越来越多,例如:智能音箱、智能机器人等。这给人们的生活添加了更多的“智慧”与“乐趣”。但目前在国内外市场上正在推广使用的各类“智能语音”应用产品都普遍存在噪声干扰环境下语音识别准确率降低的问题。因此,需要利用语音增强技术对语音信号进行降噪处理,提高识别的准确率。本文通过对相关技术的研究,改进并实现了一套基于麦克风阵列的语音增强算法。首先,对麦克风阵列技术进行了阐述,并对当前语音增强技术中面临的主要问题进行了总结。其次,分别对麦克风阵列语音信号的预处理、端点检测(VAD)、声源定位(DOA)几个模块的算法进行了研究。本文采用“基于多窗谱估计谱减法和能熵比法”的复合端点检测算法解决了低信噪比环境下利用单参数进行VAD会出现“漏音”检测的问题。在声源定位模块,利用信号和噪声频带能量差异特点,改进了一种DOA方法。此方法是基于波束指向性方法的理论,给信噪比(SNR)较高的频带部分加优化的权重因子后进行定位。测试表明,这种算法可以有效的减少噪声频带的影响,提高声源定位角度的准确性。然后,主要对线性约束最小方差(LCMV)、广义旁瓣相消(GSC)、最小方差无失真响应(MVDR)几种自适应波束形成算法进行了理论分析。以MVDR算法为理论基础,利用散射噪声场矩阵代替MVDR算法中的噪声协方差矩阵实现了一种超指向性波束形成方法的改进和优化,并进行了仿真测试和结果分析。测试结果表明此方法可以使阵列输出信号的增益更大,形成的信号波束具有更好的指向性,对实际的语音信号具有较好的增强效果。最后,针对算法硬件应用平台设计和主要实现流程进行了描述。主要对信号采集中使用的麦克风阵列电路及特点进行了分析。然后,在本文整套增强算法的基础上,对采集到不同声源角度的语音信号数据进行了仿真测试和多角度结果分析。本文通过对语音信号噪声环境的特性研究和分析,有针对性的对声源定位、波束形成等主要语音增强算法进行了改进和优化。测试结果表明,改进后的算法达到了预期设计目标,对实际的语音环境有一定的抗噪和抗干扰能力,鲁棒性有所提高,具有一定的实用价值。