鲁棒性双耳声源定位研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:shizijiazuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位技术作为一门新兴的边缘交叉学科,在视频会议、语音增强、语音识别、机器人听觉等方面有广泛的应用。目前主要的声源定位算法包括麦克风阵列声源定位算法和基于双通路的声源定位算法。基于双通路声信号的声源定位方法模拟人耳的听觉特征,可以实现较为准确的声源定位。最具有代表性的是基于互相关函数的耳间时间差ITD(Interaural Time Difference)估计,然而实际环境下的噪声和混响,会严重影响基于互相关函数的声源定位性能。所以目前双耳声源定位的研究仍有许多问题亟待解决,例如听觉方位特征参数的提取与建模、噪声与混响对定位性能的影响。   本论文的主要内容有:   1.概述了声源定位的研究背景、主要研究方法,介绍了双耳声源定位算法的理论并对现有的声源定位方法进行比较和总结。   2.提出了基于ITD、IID联合判决的定位方法,实现了水平面360°的定位,仿真测试和实际测量均说明了算法的有效性和可靠性。本论文针对传统方案的不足,对传统定位线索的提取过程进行改进。提取双耳声信号的ITD和IID参数,将均值作为声源方位的定位特征线索,建立方位映射模型。定位时,分别计算双声道信号的ITD和IID,并且利用ITD和IID特征联合判决的定位方法,解决了单纯ITD定位时存在“前后混淆”现象。   3.提出了基于子带信噪比估计的定位方法,将各方位耳间时间差ITD的均值作为声源方位的定位特征线索,建立方位映射模型。实际声源定位时,输入为双通路声信号,输入声信号先经过短时傅里叶变换,在频域划分若干子带,在各子带内进行信噪比估计,根据子带信噪比,选择相应子带的功率谱计算各帧的ITD参数,根据ITD特征参数与训练模块建立的方位特征模型进行逐一匹配,基于欧氏距离测度,输出方位。   本论文分别对HRTF数据库生成的虚拟声以及消声室环境下的采集声进行了定位测试和性能分析,仿真结果表明,基于ITD和IID联合判决的定位系统可以实现水平面360°定位。基于子带信噪比估计的双耳声源定位方法对声源类型和噪声有较强的鲁棒性,有效地提高了定位系统的性能。
其他文献
随着移动网络规模的不断扩大和各项业务的飞速发展,用户对网络服务质量和性能提出了更高的要求。移动网络的问题逐渐暴露出来,迫使电信运营商和内容提供商投入更多的人力和财力
在生活水平和质量提高的同时,人们对智能家居的需求也日益迫切。人们对家庭网络中多媒体设备间高速传输和无线互连的需求也越为迫切,传统的窄带无线通信已无法满足现代的移动
现在导航系统的应用越来越广泛,人们对它的有效性,精准性等方面的要求越来越高。但是任何一个单一系统均不能完全满足需求,所以,组合导航技术研究应运而生。目前,众多导航系统中,GP
随着无线通信业务的迅猛发展,无线通信对频谱资源的需求日益紧张。当前授权频谱资源的低利用率与日益紧张的频谱资源需求这一对矛盾严重制约了无线通信的发展。近几年新兴的认
作为现代无线通信技术的重要组成部分,数字集群通信技术已经在现代经济发展中发挥越来越重要的作用。当前我国市场上商用的数字集群系统大都采用国外的通信技术,因而有必要开展
无线通信系统与移动技术发展迅速并被广泛地应用于需要独立移动节点支撑的场合。一些场景,例如紧急救援行动,救灾,军事网络等,需要快速地建立有效,高生存性,与动态的通信链路
随着现代通信对系统吞吐量的需求不断上升,通过无线资源(时、频、功率)分配提高系统吞吐量非常重要。在多用户MIMO-OFDM系统中,由于引入了空分多址,资源在可分配的维度上增加
随着无线移动设备和服务的迅猛发展,电信运营商面临着对更高数据速率、更大网络容量、更高频谱效率、更高能量效率以及新无线应用所需的更高移动性的持续增长的需求。4G网络
为了满足人们日常对无线多媒体通信业务不断增加的需要,下一代无线通信系统急需提供更高的传输速率和更可靠的传输性能。未来无线通信网络必将是一个异构通信网络,支持多种无
移动网络的运营目前正面临着持续增长的流量压力,而底层有限的物理资源正在变得日益紧张。无线网络虚拟化能够使多种无线网络共享相同的物理基础设施资源,是处理该问题的一种