论文部分内容阅读
基于麦克风阵列的声源定位是近年来语音信号处理领域的一大研究热点。随着研究的不断深入,目前该项技术已经在视频电话会议、智能机器人、语音增强等场合中得到了广泛的应用。尽管如此,如何在真实的声场环境中定位三维空间的点声源,并进一步提高定位的精度和鲁棒性,仍然是一项有挑战性的课题,也因此受到了研究者越来越多的关注。
本文致力于真实声场环境下的三维空间声源定位的研究。在过去研究的基础之上,提出了声源定位的改进算法,并且在同步语音采集平台上建立起了实际定位系统,通过真实办公室环境的定位实验对算法进行了验证。
首先,端点检测是语音预处理中关键的一环。避免对无声的信号段的处理,不仅大大降低了运算量,而且提高了有声信号的利用率,最终提高后续定位的精度。利用噪声近似服从高斯分布以及语音和噪声相互统计独立的假设,引入了四阶累积量对语音端点进行检测,抑制了背景噪声的影响。其次,基于到达时间差的声源定位算法是当前最为流行的算法,它由时延估计和定位估计两部分组成。对于时延估计,本文在前人提出的互功率谱相位算法(CSP)算法的基础上提出了一种改进算法,通过滤除语音范围之外无贡献的互功率谱,达到增加语音主要频段内的幅度权重的目的,抑制了非期望峰值,提高了估计精度;对于定位估计,本文以已有的球形插值算法(SI)得到的定位估计作为初值,利用LMS算法进行迭代搜索得到最小方差意义下的空间最优解,克服了原SI算法中存在的误差度量函数非最优和迭代更新定位收敛不确定的问题。定位实验结果表明,本文所提出的算法使定位精度得到了较大提高,是一种行之有效的算法。