基于深度神经网络的语音增强算法研究

来源 :北京工业大学 | 被引量 : 6次 | 上传用户:shengyan1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
种类繁多的噪声存在于现实生活中的每一个角落,严重污染了人类赖以交流的语音信号。虽然现有的语音增强方法很多,但在低信噪比复杂噪声环境下,往往达不到实际应用的需求。针对低信噪比复杂噪声环境下语音增强算法的局限性,本文重点围绕基于BP神经网络和多特征的语音端点检测算法、基于深度神经网络(Deep Neural Network,DNN)的噪声分类方法以及基于DNN和噪声分类的改进最小均方误差自适应滤波(Improved Least Mean Square Adaptive Filtering,ILMSAF)语音增强算法等三方面展开研究工作。本文的研究工作主要由以下三部分组成:(1)为了提高语音端点检测算法在低信噪比复杂噪声环境下的性能,本文提出了一种基于BP神经网络和多特征的语音端点检测算法。首先,结合语音信号的时频域特征,对含噪语音提取短时自相关函数最大值和频带方差。其次,将这两种特征组成一个二维矢量输入到BP神经网络并进行训练和建模,然后利用遗传算法优化BP神经网络的参数。最后选取一个自适应阈值,利用训练好的BP神经网络判断当前帧信号的类别。实验结果表明,相较于单一特征和线性模型,本文所提算法在低信噪比复杂噪声环境下,具有更好的适应性和鲁棒性,并进一步提高了噪声环境下语音端点检测的正确率。(2)针对不同类型的噪声对语音信号的影响不同,为了使语音增强算法适用于不同的噪声环境,本文提出了一种基于DNN的噪声分类算法。该方法首先对(1)中的非语音段信号提取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和一阶梅尔频率倒谱系数(first-order MFCC,?MFCC)。其次,将MFCC和?MFCC组成一个24维矢量输入到DNN中进行训练和建模。最后利用训练好的DNN判断出当前帧信号的噪声类型。实验结果表明,相较于基于高斯混合模型(Gaussian Mixture Model,GMM)的噪声分类方法,本文所提算法的分类准确率被提高了。(3)针对现有的语音增强算法在低信噪比环境下性能不理想、在多种类型噪声环境下适应性差以及难以处理非平稳噪声信号的缺点,本文提出了一种ILMSAF语音增强模型。该模型通过在传统的最小均方误差自适应滤波(Least Mean Square Adaptive Filtering,LMSAF)语音增强中引入自适应系数来调整滤波器参数,使得滤波器能更有效地消除当前噪声环境中的噪声。在此基础上,本文提出了一种基于DNN和噪声分类的ILMSAF语音增强算法。所提方法首先利用深度置信网络(Deep Belief Network,DBN)估计出滤波器参数的自适应系数。然后利用ILMSAF对含噪语音进行增强,得到增强后的语音。另外,根据(2)中的噪声分类结果,训练出相应的ILMSAF模型,使得语音增强算法适用于不同的噪声环境。ITU-T G.160标准下的性能测试结果表明,与基于加权去噪自动编码器(Weighted Denoising Auto-encoder,WDA)和噪声分类的维纳滤波语音增强算法相比,所提算法在不同的语音主/客观质量测试中获得显著的提升。
其他文献
模块式地层动态测试仪(MDT)在辽河滩海葵东构造带油气勘探中起到了重要作用。MDT取样和光学流体分析(LFA)可直接识别储层的流体性质,并对常规测井资料进行标定,极大地提高了复杂油
介绍了KYPAM抗盐聚合物的性能评价结果.在胜利油田条件下,KYPAM抗盐聚合物的增粘能力比日本MO-4000提高68%~74%,可降低聚合物用量20%~27%.KYPAM抗盐聚合物将替代聚丙烯酰胺成为
在高职英语教学中,如何坚持以职业素质为导向提高教学的有效性是各高职院校特别关注的问题。但是就目前我国高职英语教学实际情况来看,教学现状和职业素质导向的教学目标还存
交通标志识别作为智能驾驶系统的重要组成部分,是图像处理、模式识别、机器视觉等多学科交叉研究的典型应用,也是智能驾驶系统研究领域中尚未解决的难题之一,是难度较大的实
高等教育外语教育教学中,文化教学的地位和重要性越来越引起学者们的关注。因此,研究当前高校外语教育教学中文化教育教学的现状,查找问题存在的原因,探究文化教学的策略,提
【摘 要】语文教学有多项任务,其中一项重要任务是实施文学教育。认清文学教育在语文中的地位,是正确、有效地实施文学教育的前提。从这个前提出发,才可能把握住文学教育乃至整个语文教学的归宿。作为语文教学的主体依据,文选式教科书便将文学作品放置首位。文学教育是语文教学的一项重要任务,真正意义的文学教育是在语文知识的传授和语文基本能力形成的过程中逐步实施的。  【关键词】语文教学 文學教育 语言教育 前提
Vocabulary is the basis of language learning. The study of vocabulary is an important part of second language acquisition research field. This article mainly re
期刊
裸露爆破是水下岩石爆破施工最原始、最初级的方法,通过直接把药包放于水底被爆礁石表面,直接展开爆破,该爆破法相对简单、容易操作,而且成本较低,适应性较强,被应用于航道整
赣州市南康区赞贤小学,由赣南工运领袖陈赞贤烈士亲手创办,是一所具有百年历史和光荣革命传统的学校。陈赞贤烈士一生勤学节俭、为官清正、廉洁为民,是一面鲜活的廉政教育旗帜。
在我十几年的读书生涯中,小学时的一位数学老师给我留下了深刻的印象,他批改作业的方法别具一格,使我们受益匪浅。我的数学成绩因此得到很大提高,学习数学的积极性空前高涨。因此,特将他批改作业的一些方法,特点介绍给全天下所有的数学老师,希望所有的学子也能遇上一位好的数学老师。   一、培养我们细心,习惯反思的学习品质   当我们作业中出现各种错误时,这位老师总是在我们出错的地方做上一些特别的提示符