基于声学矢量传感器的语音增强算法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:dalianmaowh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强技术是进行一系列语音信号处理中的基本问题,是语音处理系统里的核心技术之一。近年来,麦克风阵列语音增强方法由于融合了语音信号空时信息,能够获得较单通道更好的增强效果,因此逐渐成为研究的热点。然而,它们往往尺寸太大无法用于移动设备,因此对于小尺寸的麦克风阵列提出了需求。  声学矢量传感器(Acoustic Vector Sensor,AVS)是一种特殊的麦克风阵列,它体积很小,并且可以获得声波方向信息,能够很好的用于移动设备中。本文采用声学矢量传感器进行了语音增强方法的研究,主要内容包括:  1)基于波束形成技术和后置维纳滤波技术的语音增强算法研究:在深入分析波束形成技术和维纳滤波技术的基础上,提出了联合自适应波束形成和后置维纳滤波的方法和基于阻塞矩阵的维纳滤波方法;  2)面向目标语音增强的时频掩膜设计方法研究:针对自适应波束形成和维纳滤波算法难以应对声源数目多于传感器数目、对目标语音角度失配敏感以及维纳滤波器系数求解易受语音端点检测算法影响的问题,在深入分析语音信号时频稀疏性特性和声学矢量传感器间数据关系的基础上,提出了面向目标语音增强的时频掩膜设计方法。该方法对空间声源个数没有要求,对干扰声源类型也无要求,不依赖于语音端点检测算法,同时允许较大的目标语音角度失配,仅仅要求的是声源时频稀疏性的假设。仿真结果证明了该设计方法的能够有效提取目标语音且鲁棒性好;  3)基于时频掩膜的新型的语音增强方法研究:结合时频掩膜的思想,改进了现有AVS自适应波束形成方法,提出了基于精确噪声协方差矩阵估计的自适应波束形成方法;再结合波束形成和维纳滤波的思想,提出了几种新型的语音增强方法。仿真和实测实验结果证明了所提出的语音增强方法能够有效抑制非目标方向的干扰声源以及背景噪声。
其他文献
无线传感器网络(Wireless Sensor Networks,WSNs)因其巨大的应用前景和商业价值而受到学术界和工业界的广泛关注,在民用和军事上已经有了广泛的应用。居民区抄表(水表、电表
测试用例的有效生成是提高测试自动化程度关键的一步。近年来,人们开始尝试将智能搜索算法引入测试用例自动生成的领域中,取得了不错的成果。目前,主要的研究工作都是通过改
随着对现代微处理器高性能和高能效的需求日益提高,如何在低功耗和低硬件复杂度的约束条件下进一步提高微处理器性能,已经成为微处理器设计领域所面临的重要问题。为应对这一挑
对知识表示的学习一直是自然语言处理的研究目标。深层学习架构为我们提供了一种自动学习分布式特征表示的方法。通过对词的分布式特征表示的学习,基于深层学习架构的深层神经
电子设备的可靠性取决于其所采用的软硬件系统,归根到底,是其可靠的硬件基础——集成电路。集成电路的发展同时也促进计算机技术和通信技术的飞速发展,为此,保证集成电路拥有可靠
超高层建筑的施工是一个复杂的系统工程,涉及到大量的人员、设备和材料。如何在保证施工质量的前提下,尽可能的缩短工程施工时间以节约施工成本,这是每个建筑施工企业都非常关注
XML以其强大的功能,在计算机领域得到了广泛的应用,已经成为信息描述和交换的一种标准技术。XQuery被设计用来查询XML数据,树模式查询作为XQuery查询的核心,其查询效率问题成
OLAP(On-Line Analytical Processing)是一种强有力的数据可视化工具,它专门设计各种用于支持复杂分析的操作,使得管理决策人员能够对数据仓库中海量数据进行深入观察。但是,OLA
随着我国计算机网络的快速发展,黑客入侵攻击事件发生的概率随之增大,对网络安全的研究也越来越引起人们的重视。而计算机系统和网络设备上广泛存在的漏洞是成为被黑客攻击的最
关键词检索是互联网中使用最广泛的检索技术之一,也是世界上一些著名互联网站点比如谷歌、维基百科、亚马逊和IMDB等的默认检索方式。传统的关键词检索技术主要是针对无结构化