基于压缩感知理论的语音增强算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:luckchenhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类社会最重要的信息交流工具之一,它不仅是日常生活中人与人之间最常见的交流方式,也是人机之间效率最高的交互方式。现实情况下,在采集和传输过程中,语音信号会被周围环境中的噪声污染。噪声的存在不仅会影响语音信息的传递,还会使听者在心理上产生疲惫厌烦的情绪。语音增强技术的目的就是抑制或消除带噪语音信号中的噪声,从带噪语音中尽量提取出纯净语音信号。经过多年的发展,已经有很多语音增强算法被提出来,其中最经典的是谱减法、维纳滤波法、子空间方法等等。但是这些算法都是基于平稳噪声提出来的,不能很好地抑制非平稳噪声。本文首先提出一种基于先验信噪比(priori signal to noise ratio,priori SNR)估计的谱减法,解决了传统谱减法存在的音乐噪声的问题;然后基于压缩感知理论,提出了基于能量阈值的匹配正交追踪算法和基于联合训练样本字典学习算法用于语音增强,实现了较好的语音增强性能。本文的主要工作和创新如下:首先,介绍了语音增强的基础理论知识。针对谱减法存在音乐噪声的问题,本文提出了一种基于先验信噪比估计的谱减法。分析可知音乐噪声的产生主要是由于对噪声估计得不准确。本文所提算法将对噪声的估计转变为对先验信噪比的估计。通过在直接决策法中引入自适应平滑因子,来提高对每一帧先验信噪比的估计精度,减少了增强后语音中的音乐噪声,缓解了语音失真程度。仿真结果表明,在不同类型噪声下,该算法与参考算法相比,性能都有明显的改进。其次,应用压缩感知理论中的重构算法,研究了语音增强问题。现有的基于压缩感知理论的重构方法旨在重构出与带噪的原信号最相近的信号,无法有效抑制语音中噪声。针对这个问题,本文提出了一种基于能量阈值的正交匹配追踪(orthogonal matching pursuit,OMP)算法。首先通过端点检测方法对整段语音进行划分,然后对语音帧利用OMP算法进行重构,在迭代过程中通过计算带噪语音中的语音成分能量,设计了一个能量阈值来控制算法迭代次数,从而实现了自适应去噪能力,提高算法的降噪性能。仿真结果表明,在不同噪声情境下,该算法相对于其他重构算法有更好的降噪性能。最后,基于字典学习理论,提出了一种基于联合训练样本字典学习的语音增强算法,用于解决语音增强问题。现有基于字典学习的语音增强算法分别利用纯净语音和噪声单独作为训练样本得到复合学习字典。这种方法构造的字典在一定的噪声情况下不能准确地区分信号和噪声,从而导致降噪性能不理想。针对这种问题,本文在学习字典的过程中分别利用带噪语音联合纯净语音、带噪语音联合噪声作为训练样本,得到两路联合学习字典。利用两路字典分别得到两路信号的稀疏表示,利用纯净语音和噪声在稀疏表示上的互补关系对其进行加权处理,最终得到增强后的语音。仿真结果表明,该算法在不同噪声情境下,与其他参考算法相比有更好的性能。
其他文献
射频发射机是移动通信系统中的核心组件,对通信质量有着举足轻重的影响。如今迈入5G通信时代,为了满足日益增长的通信期望,需要使用各类高效频谱调制技术,这使得射频发射机系统的设计面临巨大的挑战。双输入Doherty发射机是近年来各类效率增强技术中的一位新星,得益于其带宽大、效率高、电路复杂度低等优势,有望成为高效率、高性能的射频发射机架构。然而该发射机系统的输出线性度很差,阻碍了其在通信系统中的发展与
为了满足无线通信中数据速率爆炸式的增长需求,未来的5G基站所支持的信号带宽将达到数百MHz。对于宽带零中频发射机来说,I/Q不平衡和功放非线性是影响其发射性能的两个主要失真来源。利用实验室现有的测试仪器,本文搭建了一个可用于宽带信号的功放非线性特征测试平台,并基于该平台研究了发射机中I/Q不平衡和功放非线性相关的数字校正技术。本文的主要工作可以分为以下四个方面:(1)介绍了本文搭建的功放非线性特征
信号波达方向DOA(Direction of Arrival)估计始终是雷达系统目标探测、目标追踪、轨迹合成等的一个重要测量参数。DOA估计算法也一直都是阵列信号处理的热门方向,基于不同理论的测角技术层出不穷,而其中绝大多数的算法都是建立在理想阵列模型下。但在实际工程中落地实现的过程中必须要考虑阵列非理想因素,这些阵列误差的存在使得算法模型失配,DOA估计精度降低。为了进一步的工程实用化,本文对阵
近年来,雾霾天气下的交通事故率占总交通事故率的比重逐年上升,由于能见度的降低使得人们的出行活动无法顺利进行。特别地,低能见度使得自动驾驶汽车在高速公路上的行驶更是难上加难,因此,本文针对高速公路上自动驾驶汽车前方的雾霾能见度检测方法做了研究,主要研究内容如下:(1)针对现有雾霾能见度检测设备或方法难以实现实时动态检测的问题,研究了一种基于阈带分割的公路雾霾能见度动态检测方法。首先通过图像预处理,获
随着电子信息对抗与干扰技术的发展,干扰信号的抑制对电磁战场中的有效信息传递,敌方目标的探测识别有重要意义,甚至能成为电磁战场胜利的决定性因素。论文结合某所实际项目需求,研究了干扰认知及认知情况下的自适应波束形成,其中重点研究了基于接收信号的干扰认知方法以及干扰认知的硬件实现。结合干扰认知的硬件处理流程,研究了基于CORDIC的数字下变频,多相滤波器的信道化以及基于能量检测的干扰检测和参数测量算法等
如今随着科技的发展以及人民对生活便捷化日益增长的需求,让多波束天线在5G通信、汽车自动驾驶、遥感等民用领域,得到了广泛的应用和飞速的发展。罗特曼透镜是一种常用的多波束成型网络,拥有多个输入端口和输出端口,由于其设计基于等光程原理,故罗特曼透镜多波束天线有着宽频带、波束指向不会随频率变化而改变等优点,且由于制作成本低廉、设计方便,目前已被应用在通信、电子侦察等领域和多种类型的雷达中。首先,本文详细地
随着社会的发展,人们需要处理的信息越来越多。数字信号处理技术为人们提供了进入大数据时代的有力工具。而模数转换器正是将模拟信号转换为数字信号的关键模块。逐次逼近式模数转换器(SAR ADC)因其简单的结构、较低的功耗和良好的改进潜力在诸多结构中脱颖而出,成为模数转换器研究的热点,广泛地应用在各种移动设备和医疗设备当中。本文在详细介绍和分析SAR ADC原理的基础上,采用180nm工艺,设计了一款10
2014年以后,随着国家经济形势的变化,我国银行业进入调整期。同时,银行业面临货币政策宽松、监管政策调整以及互联网银行介入的多重挑战。在此过程中,不同类型的银行因自身风控能力存在差异,导致其资产质量也呈现出不同特点。A银行作为A地财政部门控股的唯一城市商业银行,是本地区金融市场的重要参与者。面对复杂形势下的新挑战,A银行的企业贷款质量出现了明显下降。本文希望通过研究,来寻找A银行企业贷款质量下降的
如何提升无线中继通信系统的传输能力是当前的热点研究课题。现有研究大多假设无线中继通信系统的输入为理想的高斯信号,然而实际中输入基本为非高斯分布的有限字符信号,例如相移键控(Phase Shift Keying,PSK)、正交幅度调制(Quadrature Amplitude Modulation,QAM)等信号,从而导致基于高斯信号设计出的传输技术在无线中继系统中的实际性能与理论预期存在较大差距。
分子通信(MC)是利用生化信号,在自然和人工合成的纳米网络之间实现信息交换的一种通信方式。其中,分子定向通信技术可以应用在生物医学中的目标物质检测、智能药物输送。现有文献中,普遍采用基于多引诱剂、多中继的方式实现定向通信控制算法,该方式具有靶向性强的优点,适合的场景多在小区域、纳米机短距离控制上,但是实现的复杂度较高,因此研究设计复杂度低的基于趋化效应的定向通信控制算法具有重要的意义。这些年,通过