低信噪比和复杂环境下的语音增强算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:seven16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人们对语音通信质量也提出了更高的要求。语音通信的过程中会同时受到各种噪声的干扰。在低信噪比环境下,语音会被噪声所淹没,严重影响了语音通信质量,甚至会导致无法进行语音通信。因此,高鲁棒性的语音增强技术愈发重要。多通道语音增强算法引入空域信息,实现在空域上的滤波,提高了去噪性能。然而,该算法对麦克风阵列的尺寸、数目和位置都有严格的要求,设备维护要求较高,不利用低成本设备的应用。因此,本文研究单通道语音增强算法,重点研究了基于稀疏约束的非负矩阵分解(NMF)算法,并针对该算法提出改进,针对改进算法,工程实现了实时在线语音增强系统。传统的语音增强算法需要使用噪声估计算法对噪声进行估计,但信噪比和复杂噪声环境下噪声估计误差较大,造成传统算法去噪性能降低。NMF算法不需要噪声估计,依据增强前训练的噪声字典和语音字典,将带噪语音功率频谱幅度通过矩阵分解求解噪声分量和语音分量,从而增强语音,去噪性能优于传统算法。本文重点研究了NMF算法的改进算法——稀疏约束的NMF算法,探讨了噪声是否匹配对稀疏约束的NMF算法性能的影响,并进行实验验证。结合梅尔频谱特性和非负矩阵分解的原理,不同于传统的使用普通幅度频谱作为数据进行矩阵分解,采用了基于梅尔频谱为数据进行矩阵分解的方法,提出了一种基于梅尔频谱的稀疏约束的NMF算法。实验证明,改进后的算法PESQ得分优于传统算法,算法复杂度大大降低。现有的稀疏约束的NMF算法使用固定的噪声字典和语音字典,当带噪语音的噪声和噪声字典不匹配时,去噪性能下降。本文基于此问题,改进了原有算法,设计并实现了基于稀疏约束的NMF算法的语音增强系统,分为两个方面进行改进,一方面设计滤波器模块,引入了稀疏度的计算方法,并通过稀疏度计算语音存在概率,使用语音存在概率和后验信噪比设计自适应参变因子改进原有滤波器,设计的参变因子能够在不同频段和信噪比自适应调节大小,实验证明改进后的滤波器的稀疏约束的NMF算法的PESQ得分优于传统算法。另一方面,设计了自适应噪声字典更新模块,使用计算的语音存在概率选择性更新噪声字典,实验证明了自适应噪声更新模块在低信噪比下的PESQ得分有一定提升,增强了噪声字典的鲁棒性。最后,在树莓派平台上工程化实现了基于稀疏约束的NMF的语音增强系统,设计的语音增强系统分为两个大模块,训练模块和在线增强模块,训练模块实现了批处理训练音频,在线增强模块实现了批处理增强音频和在线增强音频,在线增强音频增加了录音读入模块和录音处理模块,并通过openblas矩阵运算库优化矩阵运算、优化内存结构、优化代码结构等方式实现算法优化,降低了工程实现的算法运算时间,实现了实时的在线增强音频处理功能,并通过树莓派进行测试,证明了优化后算法运算时间大大降低。
其他文献
随着勘探程度的逐渐提高,低幅度构造的勘探逐渐受到重视。塔北隆起西段中、新生界是库车陆相油气向南运移、聚集成藏的有利区,白垩系巴西改组在火山岩潜山构造背景下的低幅度构造已获突破,继而展示了塔北西部中新生界低幅度气藏具有良好的滚动勘探前景。本文针对该区深度域资料,首先通过地层切片研究,印证了下伏火山岩潜山低幅度构造背斜发育的基础,再通过地质条件的分析及高精度的构造图编制等技术措施,探讨了在解释阶段研究
古往今来,图像信息在人们生活工作的方方面面都发挥着至关重要的作用,但由于受各方因素的影响,图像质量并不能得到保证,这对图像恢复的工作提出了更高的要求,去噪和去模糊是图像恢复中主要的成像逆问题。在目前比较流行的深度神经网络方法中经常使用大量数据集来训练模型完成图像恢复工作,但是却无法应对缺少数据或无法获得原始数据的情况。此外,当训练中的观察模型与测试模型不匹配时,深度网络的方法表现不佳。针对以上问题
随着科学技术的不断发展,数字信号处理技术越来越成熟,电子医疗、智能家居、工业控制等领域对于相关技术有了越来越高的需求。模拟电路和数字电路之间的转换电路——ADC,是众多电子类产品中非常重要的电路模块。基于过采样技术与噪声整形技术的Sigma-Delta ADC,具有高精度、高信噪比和容易集成等优点,因此得到了广泛的应用。Sigma-Delta ADC由模拟部分的调制器电路和数字部分的抽取滤波器电路
近场通信(Near Field Communication,简称NFC)技术由非接触式射频识别(RFID)技术及互联互通技术整合演变而来,具有速度快、安全性好、抗干扰能力出色等特点。近年来NFC技术大量应用于包装盒技术,NFC技术的加入使得包装盒对用户更加友好,使得人机交互更加便捷,也促使智能包装逐渐应用于物联网领域。但目前实际应用中的NFC防伪措施存在易伪造、易转移等缺点,无法起到真正的防伪作用
随着量子通信在理论和实验方面的研究逐渐成熟,量子通信技术的实用化成为研究热点,其中,量子保密通信网络是一个重要方向。目前,专用量子通信网络已经在实际场景中成功搭建,但由于专用量子通信网络建设成本太高,并且需要经典网络的辅助,因此研究者们提出一种解决方案,即量子信息、经典信息和量子保密信息共纤传输,搭建经典通信与量子通信兼容的量子城域网。该网络中经典信息可以通过所有路由器进行转发,量子保密信息只能通
本文针对宽带阵列天线进行了研究,主要工作如下:1.结合工程项目需求,研究了具有波束扫描功能的宽带偶极子阵列天线。改进了马春德(marchand)巴伦,所设计的馈电结构实现了三阶阻抗匹配,有效展宽了偶极子天线的带宽。在HFSS软件中对天线进行全波仿真分析,同时给出其等效电路模型,利用HFSS和ADS联合仿真对天线进行带宽验证。所设计出的天线在电压驻波比(VSWR)小于2时,具有72.7%(工作频率范
新型超材料天线相比于传统相控阵天线有着系统简单、成本低、轻便、产生的随机辐射场稳定等多方面的优势,因此近几年超材料天线甚至有着逐步取代相控阵天线的趋势。虽然超材料天线可以代替相控阵天线以获得更高质量的导引头的前视成像,但是由于超材料天线必须使用载频变动的信号,这使得信号回波中出现了一个相位误差,导致适用于相控阵天线的基于压缩感知的超分辨关联成像算法,虽然其成像分辨率高、运算速度较快,但是却无法正常
随着无线通信技术的飞速发展,低频段的频带资源开发日渐饱和,人们迫切需要对毫米波以及更高频率的频谱资源进行开发和利用。间隙波导作为一种非接触式半封闭的新型波导结构,具有低损耗、易加工、可模块化的优势,在毫米波以上频段的天线阵列、大型馈电网络、滤波器、有源器件封装等工程设计中具有广阔的应用前景。毫米波多波束天线可以使用无源波束赋形网络实现毫米波天线的波束扫描,提高天线的增益,实现频谱资源利用率的最大化
近年来,随着图像处理技术以及人工智能深度学习技术的发展,基于计算机视觉的目标检测在精度和速度上都达到了理想的性能。然而在自动驾驶相关领域中,仅依靠图像平面上的二维检测结果,无法有效获取目标在三维空间中的位置与结构信息。虽然依靠激光雷达等传感器设备可以获取空间信息,但相比之下单目相机更为经济便捷。因此,针对单目场景下的三维目标检测技术的研究有着重要的现实意义,同时具有广泛的应用前景。随着深度学习技术
现代战争是电子战和信息战的战争。为了满足侦察、干扰、探测、通信等多样化的作战需求,一个完备的作战平台往往集成了多种分立的电子作战装备,极大限制了作战平台的机动性能。而集侦察、干扰、探测、通信于一体的侦干探通一体化作战平台通过参数可配置的硬件和软件实现单一平台多功能于一体,体积小、灵活度高,是未来作战平台发展的必然趋势。可重构接收机在不改变硬件的条件下仅通过调整可配置参数即可以实现多种信号处理模式,