混响和噪声环境下多声源定位与计数

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:pengxiubin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于麦克风阵列的声源定位系统在电话会议、视频会议、移动机器人以及语音增强等系统中被广泛应用,尤其在无人值守环境下的视频监控系统中发挥出很好的实用价值。在实际环境中,由于存在噪声与混响的干扰,使得定位系统的精确度受到了较大的影响,此外,现有的声源定位算法具有较高的运算复杂度,为了满足定位实时性的要求,通常会损失定位的精确度。声源数目在声源定位、跟踪等算法中作为非常重要的先验信息,当声源数目估计错误时,会使声源定位、跟踪算法性能受到很大影响。对于上述问题,本文针对声源定位和声源数目估计算法进行了研究,并在混响和噪声环境下对本文提出的算法进行验证。本文主要工作和研究内容如下:(1)麦克风阵列接收的信号主要包含有用信号和其它噪声,需要对麦克风接收信号做预处理操作,主要包括归一化、预滤波、预加重、加窗分帧、语音去噪、端点检测等;明确了声场的划分原则;引入了麦克风阵列的信号接收模型;分析了传统的窄带和宽带信号处理模型;介绍了室内混响的概念和房间单位冲激响应镜像源模型,并进行了仿真分析。(2)对常规声源定位算法进行了研究,重点介绍基于可控波束形成算法,分析了算法的计算复杂度,在延时求和波束形成算法基础上使用加权函数进行改进;基于麦克风阵列的坐标信息构建单位球体,通过设置网格的分辨率来决定导向波束形成器空间搜索的分辨率;使用贝叶斯概率组合来增强波束形成器输出结果,提高了定位算法的精确度和可靠性,最后通过仿真实验对改进算法进行了验证。(3)对传统声源计数算法进行了研究,针对复杂环境以及欠定条件下,首先利用语音信号的频域幅度相干函数在相干语音处和漫射噪声、混响对应的频率处显示的峰值不同的特征,然后通过计算语音信号频域幅度相干特征矩阵并使用K-medoids聚类算法对该特征聚类来实现不同位置的声源计数。最后,在不同的混响时间、信噪比、阵元间距条件下验证了算法的性能,实验结果表明,本文算法在混响环境下能够实现准确的声源数目估计,同时对阵元间距具有较好的鲁棒性。(4)构造一套低功耗、低延迟、体积小的多通道音频采集系统,详细介绍了麦克风声卡和音频采集卡的电路设计,并在此基础上完成了基于八麦克风阵列声源定位的系统硬件平台搭建。针对音频采集系统做了整体测试,包括体积、功耗、相邻通道之间的采集延迟等,验证了音频采集系统的可靠性和准确性。在此基础上,搭建声源定位系统硬件测试平台,在混响实验室内对声源定位系统进行了距离定位测试,声源数目定位测试,以及对多目标声源角度定位测试等,测试结果表明了本文的声源定位系统在混响和噪声环境下具有可行性。通过上位机完成预处理模块、声源定位模块软件部分设计,最后设计GUI便于参数配置和定位结果实时显示。
其他文献
随着传感器技术的不断发展,高分辨遥感影像带来了更加丰富的空间细节信息,基于高分辨率遥感影像的建筑物检测在城市规划等领域中发挥着关键作用,同时基于震后遥感影像的倒塌建筑物检测有助于摆脱对震前数据的依赖,对及时开展应急响应具有重要的意义。目前基于高分遥感影像的建筑物检测主要分为城市场景中的建筑物检测与震后场景中的倒塌建筑物检测。前者基于形态学属性剖面的方法通过对建筑物多属性、多尺度的精细刻画,在缺乏海
学位
随着全球气候变化,极端天气事件的频率也随之增加,以足够精细的时空分辨率提供准确的气象预报变得越来越重要。其次,在一些特殊观测地区,基础设施并不完善,导致气象数据难以采集,从而缺少气象预报产品。因此,气象预报的研究有着举足轻重的意义。自神经网络发展以来,它被迅速的应用于各个领域,气象预报也不例外,众多科研家逐渐开始利用人工智能的方法解决气象预报领域中出现的问题。针对广东省降水因素复杂、偏远地区无法获
学位
近年来,随着图形处理器等硬件的更新换代,基于深度学习的图像语义分割方法发展迅速。这些语义分割方法大多基于完全监督标注,其标注的制作成本高昂。语义分割方法与弱监督学习相结合成为新的研究方向。在弱监督标注的选择方面,大多采用基于图像级别标注的类激活映射方法。本文设计相关的优化方法旨在挖掘弱监督标注和网络自身的监督信息,其主要工作可概括为以下两个阶段:第一阶段是基于等变约束的伪标注生成阶段,本文提出一种
学位
大气电场是研究雷暴云形成及发展过程的重要依据,是大气电学领域的基本参数。大气电场仪是监测户外大气电场变化的仪器设备,对雷电灾害预警和放电过程研究具有重要价值。针对传统大气电场仪存在信号调理电路复杂、芯片陈旧等问题,采用新型集成电路设计大气电场仪,并研究大气电场仪的标定和数据修正方法。主要研究内容和结论如下:(1)针对传统大气电场仪信号调理电路输出信号线性度较差、集成度不高等问题,选用新型集成电路改
学位
随着非线性动力学理论的发展,离散混沌动力学迎来了又一个研究热潮。为增强混沌映射在图像加密中的应用效果,常需要获取调控便捷、复杂度高的时间序列。忆阻器特殊非线性反馈容易引发混沌,从而已成为混沌系统构建的重要元素。本文研究具有较高复杂度的超混沌映射的建模,研究其偏置可控与多稳态属性,通过数值分析和硬件实验进一步证明超混沌映射的特殊演变规律,为超混沌映射在图像加密中的应用提供依据。本文的主要工作包括:一
学位
随着机器学习、深度学习的发展,使用带标签的数据集进行监督训练可以很好地实现各种不同的任务,在多种应用场景也有不错的效果,但面对海量的缺失有效标注信息的数据,进行数据标注需要耗费大量的人力、物力和时间成本。另一方面,用训练集数据进行训练得到的模型可能出现无法适应现实场景的问题。无监督域适应算法可以在源域与目标域样本特征分布不同但相似的前提下,将源域样本分类模型迁移到目标域,使模型适应目标域数据。本文
学位
鸟类是生态系统的重要组成部分,对鸟类活动及其分布的监测,为了解一个地区的生物多样性和气候变化提供了重要的依据。鸟鸣声是区分鸟类的重要特征,鸟鸣声识别也是目前鸟类物种识别普遍采用的方式之一,通过鸟鸣声实现鸟类监测具有高效、稳定、范围广的优点,具有巨大的应用价值。在复杂的自然场景下采集到的鸟鸣声数据往往存在大量的环境背景噪声,设计一种鲁棒性高、抗噪声能力强的鸟鸣声识别方法对了解鸟类生物多样性具有重要意
学位
电磁诱导透明效应(electromagnetically-induced-transparency,EIT),因其强色散和慢光效应,在微纳光学领域具有广泛的应用前景。本文采用EIT模式耦合原理,通过时域有限差分法,在太赫兹波段,设计并研究了基于石墨烯超材料的可调EIT效应及其传感特性。主要内容如下:1.设计并研究了基于明-暗模式耦合的EIT效应。通过石墨烯切割线阵列结构,在0.2-1.2 THz波
学位
光纤传感器因为其抗电磁干扰、柔韧性高、响应快、质量轻等优势始终在传感领域中有着一席之地。本文基于化学腐蚀方法设计制作了两种不同结构的光纤法珀传感器,并对其进行了详细的理论分析,搭建了实验系统进行了折射率和温度的实验测试。本论文的主要工作如下:1、为了解决传统光纤传感器温度串扰的问题,本文设计了一种基于化学腐蚀的闭合腔光纤法珀传感器。基于三光束干涉的原理,分析了空气腔腔长和单模光纤腔腔长对反射谱的影
学位
光纤传感器有着灵敏度高、体积小等优点。在光纤传感技术发展过程中,马赫-曾德尔(Mach-Zehnder,M-Z)光纤传感器经过多年研究,已在环境监测、工业生产、桥梁建筑等领域有着广泛的应用。本文提出一种纤芯失配型M-Z光纤多参数测量传感器,利用无芯光纤充当耦合器,实现分光和耦合的作用。该传感器有着简单的结构和较高的灵敏度,能够对折射率、温度、曲率和应力多个参数测量,且消除温度串扰。论文的主要工作内
学位