声源定位算法及实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:e7889620621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于麦克风阵列的声源定位是近年来语音信号处理领域的一大研究热点。随着研究的不断深入,目前该项技术已经在视频电话会议、智能机器人、语音增强等场合中得到了广泛的应用。尽管如此,如何在真实的声场环境中定位三维空间的点声源,并进一步提高定位的精度和鲁棒性,仍然是一项有挑战性的课题,也因此受到了研究者越来越多的关注。 本文致力于真实声场环境下的三维空间声源定位的研究。在过去研究的基础之上,提出了声源定位的改进算法,并且在同步语音采集平台上建立起了实际定位系统,通过真实办公室环境的定位实验对算法进行了验证。 首先,端点检测是语音预处理中关键的一环。避免对无声的信号段的处理,不仅大大降低了运算量,而且提高了有声信号的利用率,最终提高后续定位的精度。利用噪声近似服从高斯分布以及语音和噪声相互统计独立的假设,引入了四阶累积量对语音端点进行检测,抑制了背景噪声的影响。其次,基于到达时间差的声源定位算法是当前最为流行的算法,它由时延估计和定位估计两部分组成。对于时延估计,本文在前人提出的互功率谱相位算法(CSP)算法的基础上提出了一种改进算法,通过滤除语音范围之外无贡献的互功率谱,达到增加语音主要频段内的幅度权重的目的,抑制了非期望峰值,提高了估计精度;对于定位估计,本文以已有的球形插值算法(SI)得到的定位估计作为初值,利用LMS算法进行迭代搜索得到最小方差意义下的空间最优解,克服了原SI算法中存在的误差度量函数非最优和迭代更新定位收敛不确定的问题。定位实验结果表明,本文所提出的算法使定位精度得到了较大提高,是一种行之有效的算法。
其他文献
随着互联网和宽带技术的发展,人们已经不再局限于文本方式的网上冲浪,技术的发展使人们能够在互联网上观看视频,相应的服务随之产生,例如视频点播(VOD)、网络电视、网络视频教学
随着通讯行业的迅速发展,为了确保通信网络的正常运转,提高网络的可靠性、易用性和获取网络数据的实时性,对网络管理水平提出了更高的要求,设计并开发一种高效的网络性能管理系统
当今社会,交通拥塞日益严重已经成为制约经济发展的主要因素之一。为了在现有道路条件下实施交通规划和控制,在路网出现拥挤的情况下进行交通诱导和事故处理,必须对交通流的特性
本文基于状态估计理论与方法,研究了目标跟踪中的有关有偏滤波策略设计问题。通常的估计问题,大多要求待估量达到无偏最小方差估计。为实现无偏估计,系统运动模型的阶次需要与目
负荷预测对于电力部门有计划地制定电网规划至关重要,历史的电力负荷值受温度、季节等诸多因素的影响,可看作为具有强非线性和非平稳特性的复杂非线性时间序列。目前,神经网络、支持向量机等单一的计算智能方法是主要的电力负荷预测工具。回声状态网络(echo state networks,ESN)作为一种新的动态递归神经网络,已引起研究者的广泛关注,并且已经应用于电力负荷预测中。与常规的递归神经网络相比,它在网
随着社会经济的发展,物流管理及其优化越来越受到重视,运输成本占有率的居高不下呼吁对运输优化方法与理论的研究。联盟运输调度问题(Allied Vehicle Routing Problem,AVRP)研究
集气管压力系统是一个耦合严重、非线性、扰动频繁剧烈的多变量时变系统,很难用常规方法加以控制。随着控制理论的发展、计算机技术的成熟,在很多地方采用了模糊控制与专家控
本文主要讨论的是稀油润滑系统的油温控制问题。根据实际要求,该系统在工作中,必须将稀油的工作温度维持在一定范围内,要求油箱温度的控制精确为±5℃以内。由于稀油的最高温度