基于稀疏表示和深度神经网络的语音增强研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:welson926
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际生活环境中,不可避免受到各种噪声干扰,而语音增强技术旨在从带噪语音中去除噪声,提高语音质量和清晰度,可广泛应用于现代通信系统、助听器和语音识别等领域。近年来,鉴于深度神经网络(Deep Neural Networks,DNN)具有模拟带噪语音特征和学习目标之间非线性关系的能力,被广泛应用于信噪比极差或非平稳噪声背景的语音增强中。故本文采用DNN模型估计时频掩模,达到降低运算复杂度、进一步提高语音可懂度的目的。本文所做的主要工作如下:(1)介绍语音增强的研究意义,从无监督和有监督两方面分析目前语音增强的研究进展,并重点阐述有监督语音增强方法取得的研究成果。详细介绍基于DNN语音增强系统中的模型、特征、学习目标三个主要模块。(2)针对DNN运算复杂度高、容易过拟合的问题,同时为促进时频掩模去除噪声并保留语音成分的能力,提出一种自适应软掩模优化正态稀疏DNN的语音增强方法。首先,提出将具有方差参数的正态概率密度函数作为稀疏惩罚项加入目标函数,该惩罚项根据隐含层单元的激活概率与常数因子的偏差、并设置方差参数,共同控制数据稀疏度,从而提取到简洁有效特征的同时提高运算速率;其次,提出一个与信噪比有关的tanh型自适应调节因子,控制理想二值掩模和理想浮值掩模在学习目标中所占的比例,滤除噪声的同时减少语音失真;最后,设计多组实验,证明正态稀疏DNN结合自适应软掩模,在提高语音可懂度、减少失真的前提下,有效减少运行时间。(3)为使增强的语音符合人耳的感知特性,进一步提升语音可懂度,本文提出Gammatone耳蜗幂率倒谱系数和融合相位差信息的软掩模,共同优化正态稀疏DNN的语音增强方法。首先,用更符合人耳听觉感知特性的幂函数对初始特征进行压缩和离散余弦变换去相关处理,并融合一阶、二阶差分特征,可以有效捕捉语音瞬时变化信息,保持听感连续性,再用改进的自回归滑动平均滤波器平滑特征,去除毛刺,即得到Gammatone耳蜗幂率倒谱系数;其次,考虑相位中含有与语音可懂度相关的信息,且相位差可以提供有效的频谱结构信息,故将带噪语音与纯净语音的相位差、带噪语音与噪声的相位差融入自适应软掩模中,达到提高增强语音可懂度的目的;最后,各种噪声背景下的实验结果表明,Gammatone耳蜗幂率倒谱系数整体性能优于其它对比特征,同时证明融合相位差信息的软掩模可有效提高语音信号的清晰度,降低听觉的疲劳感。
其他文献
二十世纪下半叶以来科学技术日新月异的进步,使人们对生命的认识逐步从器官、组织水平深入到细胞、分子水平。生物传感成为当代科学研究的前沿领域。生物传感器被广泛的应用在环境监测、食品工程、临床医学诊断等领域,提高生物传感的灵敏度对生命科学的发展具有重要意义。荧光检测作为生物传感领域一种常用的检测方法,具有实时、高效、直观、灵敏等特点。量子点因其相较于其他荧光染料物质具有发光强度高、光稳定性好、生物相容性
随着纳米医学的飞速发展,将纳米医学应用于肿瘤的诊断与治疗是肿瘤研究的重要发展方向。同时集成肿瘤诊断与治疗于同一纳米器件上得到多功能的纳米诊疗平台,在精准医疗和临床
绩效管理是人力资源管理的重要内容,是人才管理的重要手段。PY工厂产品开发部是A公司全球零售服装标签产品开发的总部,产品开发员工是A公司的重要资源。建立科学合理的绩效管
学位
利用工业固废,采用烧结法制备的微晶玻璃常出现表面凹凸不平、内部气孔增多或结晶度偏低等问题。为了解决这一问题,实现工业固废的资源化利用,本文通过分析常用于制备微晶玻
本毕业论文的核心成果是在Hilbert空间中研究了渐近非扩张映射不动点与均衡问题解的公共元的求法.运用Halpern类迭代算法构造一类新的转型迭代序列,并且在相对较弱条件下证明
配位聚合物是当今各领域科研人员的研究热点,在气体的吸附、分离、存储、多相催化、荧光发光、磁性材料、电催化、非线性光学性等多方面具有无限的潜在应用前景。本论文选取
癌症,即恶性肿瘤,已成为世界范围内的主要死亡疾病之一。肿瘤标志物是恶性肿瘤在发生发展过程中肿瘤细胞分泌的一类生物活性分子,其存在水平可反应恶性肿瘤发生的变化情况,从而了解肿瘤的细胞功能、细胞分化和组织发生情况。癌胚抗原(CEA)是一些癌症的重要肿瘤生物标志物,作为临床诊断的广谱肿瘤标志物已被广泛研究,对肿瘤的早期诊断和早期治疗作出了重要贡献。光热效应是指光辐照于材料时将一部分能量转化为热能的现象。
指纹因其具有唯一性、普遍性、稳定性以及易采集性,使得指纹特征在众多的生物特征识别中得到了广泛的应用,其中包括刑侦、身份识别等领域。从上世纪九十年代我国开始对指纹识别技术进行研究和应用,发展至今已有将近三十年的历史,取得了很多优秀的成果,特别是针对高质量的指纹图像,已经发展的非常成熟。但是,在实际的指纹采集过程中往往因为手指表面存在缺陷,手指或指纹采集传感器表面存在污渍等原因,会使得采集得到的指纹库
混合动力汽车和消费电子产品的快速发展对锂离子电池提出了更高的要求,基于固体电解质的全固态锂电池具有能量密度高、循环寿命长和安全性好等优势,从而成为研究者关注的焦点