基于时频掩蔽的麦克风阵列语音增强算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fbcpingqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为信息的载体,在生活的诸多场景中都发挥着至关重要的作用,如智能驾驶、智能家居和视频会议等场景。但在实际生活中,人们接收到的语音都掺杂着各种噪声,这些噪声极大地影响了语音的质量及可懂度,因此需要语音增强算法去除带噪语音中的噪声,使语音的质量和可懂度得到提升。本文从以下三个方面开展对麦克风阵列语音增强技术的研究:基于时频掩蔽的语音失真加权多通道维纳滤波(SDWMWF)、基于掩蔽的后置滤波以及基于时频掩蔽的改进SDW-MWF。波束形成算法在进行语音增强时需要阵列与声源的先验信息,一旦这些先验信息存在偏差就会严重影响算法的去噪性能。本文采用的SDW-MWF算法,可以在不需要这些先验信息的情况下,依据估计出的噪声协方差矩阵,求解对应的权重,进行语音增强。传统的噪声协方差估计算法如语音活动检测(VAD)和语音存在概率(SPP)算法可能会使得噪声协方差估计存在偏差,导致输出语音存在失真或仍有大量噪声残留。本文借助基于时频掩蔽的方法来进行噪声协方差的估计,通过假设观测信号满足复高斯混合模型(CGMM),采用期望最大化(EM)算法计算麦克风阵列采集语音每个时频单元是噪声的概率,实现对噪声协方差的估计,并将其用于SDW-MWF算法中。实验证明,本文提出的增强算法可以提升输出语音的PESQ值和STOI值。SDW-MWF算法对噪声抑制性能有限,因此本文将其与基于掩蔽的后置滤波技术相结合,去除SDW-MWF算法语音增强后残留的噪声。基于掩蔽的后置滤波算法采用理想二值掩蔽(IBM)算法及其改进算法理想比值掩蔽(IRM)算法,因此需要时域噪声作为输入,本文采用一种基于多通道维纳滤波(MWF)的噪声估计算法来得到时域噪声,该算法借鉴MWF算法中的求解期望信号的方式,通过将MWF算法中的期望信号置换为噪声来实现对噪声的估计。将基于时频掩蔽SDW-MWF的输出与噪声估计得到的时域噪声作为后置滤波的输入,最终实现了对噪声的进一步抑制。实验证明,IBM后置滤波会在噪声得到进一步去除的同时导致输出语音失真,而IRM后置滤波输出语音中的噪声得到进一步抑制,语音质量得到了提升。在进行麦克风阵列语音增强时,大多数情形下只有一个目标声源信号,所以本文在只有一个目标声源信号的前提下对SDW-MWF算法的性能进行分析,分析其缺点并提出改进算法。改进的算法相比SDW-MWF更加简化,且输出语音质量更高。本文将基于时频掩蔽的SDW-MWF算法与基于时频掩蔽的改进SDW-MWF算法通过实验进行对比,实验证明,改进算法输出语音质量得到了提升。本文采用的基于六麦均匀线性阵的麦克风阵列语音增强算法在近远场情形及多种噪声下都可以取得好的语音增强效果,可将其应用在视频会议系统或其他需要语音增强的场景中进行噪声抑制。
其他文献
自从市场经济在我国建立以来,伴随着我国市场经济的快速运行,我国在垄断行为规制方面也制定了相关法律法规,2008年我国颁布并实施了《反垄断法》,十二年间我国市场经济体制日渐完善,反垄断制度也在不断发展。相关市场是反垄断法的核心概念,相关市场界定是反垄断执法工作的重要前提。作为测量市场份额和间接判断企业市场支配地位的基础理论,相关市场界定是对企业市场垄断行为判定的出发点和落脚点,因而在反垄断案件中起着
我国城市基层社会管理体制经单位制、街居制向社区制转变,使得城市社区开始承接原先由单位供给公共服务的功能。城市社区公共服务的供给属于基层社会治理最为主要的构成内容,包含政府、社会力量与市场主体等众多主体在内,其对城市社区供给公共服务已然成为大势所趋。在多元主体合作供给环节,众多主体将一同参与到公共服务供给过程之中,由于它们之间有着相同的目标,使得这些主体彼此间的边界逐渐模糊化,甚至产生集体不负责或者
近年来,随着家长对孩子的教育重视程度不断提高,以及中高考竞争压力不断增大,参加校外培训的学生越来越多,这使得我国中小学校外培训市场得以迅猛发展。但是,在其规模快速扩张的背后,各种乱象频出。为了解决中小学生课外负担过重的问题,进一步规范中小学校外培训市场秩序,2018年2月,教育部等四部门印发了《关于切实减轻中小学生课外负担开展校外培训机构专项治理行动的通知》,开启了校外培训市场的整治风暴。截止目前
服装业是我国传统的支柱产业,在我国经济发展中发挥着重要作用。自九十年代中期以来,中国一直是世界上最大的服装生产国和出口国。尽管近年来由于中国经济增速放缓和世界经济复苏缓慢的原因,中国服装业增速有所下降,但政府加强了对纺织服装业的支持,原因是因为作为中国国民经济的重要支柱和主力军,服装行业可以通过出口赚取外汇。2010年,国家“十二五”规划提出了到2020年建设纺织强国的远大目标:提高家纺和家纺品牌
党的十九大报告提出要“加强社会心理服务体系建设,培育自尊自信、理性平和、积极向上的社会心态”。中国社会和学术界同样对当前的社会心态走势高度重视。总体而言,当前我国民众的社会心态呈现出健康向上、开放包容的特征。但是随着经济社会转型,网络空间中公域与私域的融合、公共风险潜伏以及社会矛盾激化等引发诸多风险源,造成部分民众社会心态失衡,进而产生网络社会心态风险。他们将不满情绪或语言暴力诉诸于网络平台,使得
破伤风是由破伤风梭状芽胞杆菌分泌的一种神经毒素引起的严重疾病,主要临床症状为牙关紧闭,局部或全身肌肉呈阵发性或强直痉挛,因此又称强直症。灭活毒素(类毒素)制成的破伤
环渤海区域处于东北亚经济区的中心地带,是中国北部的黄金海岸,包括辽东半岛、山东半岛、京津冀三省二市,同时辐射到山西省及内蒙古中部和东部盟市。全区陆域面积达112万平方
改革开放,国门大开,经济蓬勃发展,物质生活水平提高,中国经济迎来了高速发展,已经引起各国的关注。习近平总书记在2018年4月10日的博鳌亚洲论坛开幕式上发表主旨演讲时指出加
搞好安全生产管理,就必须要切实掌握从一般到特殊,从特殊中找出它的关键环节。本文认为,安全管理:教育培训是前提,风险控制是关键。
本文依托3D打印耗材制备挤出生产线的智能化升级项目,基于物联网技术和人工智能技术,在设备运行状态核心参数的采集方式、工艺条件的准确和快速确定以及设备能耗的精确分析方