基于条件深度卷积生成对抗网络的语音增强模型研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:TeaTempTea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音交互技术在现实生活中得到了广泛的应用,比如自动语音识别系统、智能家居、移动语音通信,但由于干扰的存在,现实环境中语音交互技术远没有达到令人满意的程度,语音增强技术是提高语音交互性能的有效途径。本文在阐述了语音增强的相关背景和研究现状后,针对语音和噪声的特征,提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)语音增强模型,C-DCGAN模型是在生成对抗网络(GAN)的基础上加入卷积层和条件信息。C-DCGAN利用生成器中的卷积层自动提取语音特征,利用提取的特征生成语音样本。然后将生成的语音样本和纯净的语音样本同时输入到判别器中,判别器判断生成的语音样本为真或者假。最后通过反向传播训练网络模型,使生成器生成尽量接近纯净语音的语音样本,同时使判别器能判别真实的样本和生成的样本。C-DCGAN模型通过对抗博弈的方法进行训练,在对抗博弈中,生成器获得了语音信号的隐含特征,从而可利用提出的模型输出接近纯净语音的语音信号。在模型训练完成后,将混合语音输入到模型中,生成增强后的语音,从而实现对带噪语音的语音增强。为了评估C-DCGAN模型的性能,本文搭建了基于Tensorflow的语音增强平台。通过在多种噪声数据集中进行实验对比和分析,证明了本文提出的模型能够实现对带噪语音的增强,并具有较好的泛化能力,与目前已提出的谱减法、DNN等语音增强方法相比,在PESQ和STOI等指标上均有提高。本文的方法为今后该领域的研究提供了思路,具有一定的理论价值和应用价值。
其他文献
由于工程技术人员对机制砂混凝土缺乏足够认知,配制出的机制砂混凝土工作性差、可泵性差,出现离析泌水等问题,混凝土外观质量较差。基于云南普立至宣威高速沿线机制砂的应用
本文对大力推动自保温墙体技术进行了阐述。建筑节能事业和禁实工作持续推进的历史机遇期重合,为自保温墙体技术提供了千载难逢的发展机会。自保温墙体技术不仅能适应持续提
高效利用太阳能净化水是解决水资源危机的一种非常有吸引力、可再生且环保的方式,具有重要的现实意义。然而,传统的太阳能蒸发水过程往往采用高温加热大量的水,这种方法需要将太阳能集中并且伴随能量和光学的损失。因此,探索和设计太阳能吸收材料,高效的将太阳能转化成热能至关重要。近年来,三维石墨烯材料因为其低成本、高效宽带吸收、多孔结构和高的太阳能热转换效率等优点在太阳能蒸发水领域受到了广泛的关注。在本论文中,
<正> 辽宁成大股份有限公司(以下简称辽宁成大)是在改组辽宁省针棉毛织品进出口公司(以下简称针棉毛公司)的基础上,于1993年6月以定向募集方式创立的。针棉毛公司原是具有40
目前,我国农村地区金融供求之间存在严重矛盾。一方面,金融产品供给及种类较少,较难满足农户进行农业生产的资金需求。另一方面,随着城市化进程的加快,土地有了流转的需要,资
<正>栈道多依深不见底的悬崖峭壁而建造,随山势而旋转。或是千尺奇峰,悬崖绝壁,或是深谷涧壑,万丈深渊,险要处仅可容身。栈道的修筑始自战国秦。在古代就存有"明修栈道暗度陈
会议
英国当代著名作家朱利安·巴恩斯的小说《终结的感觉》2011年出版即赢得英国曼布克奖。这部作品从男主人公托尼·韦伯斯特的叙事视角出发,通过男主人公对自己从中学到大学生活的回忆和反思,折射出求学经历对其随后人生的投射与影响。小说自问世之处即以其颇具后现代主义风格的精悍语言、独具创新的叙事结构和哲学思考引起学界的关注,已有的研究涉及对小说人物自我身份建构、历史观、伦理道德主题、叙事策略与技巧等方面。本论
新经济时代来临的同时,消费者的消费水平增高其消费观念也相应升级,他们审美观念与消费观念产生重大改变,使品牌在塑造过程中,不仅要满足基本功能需要,更要关注产品传达的情
总结7例后路半椎体切除术治疗先天性胸腰椎半椎体畸形的围手术期护理。术前做好心理护理及准备;术后严格保持正确体位以保护脊髓,提高骨融合率,严密监测生命体征,观察脊髓和
随着印制电路板(PCB)和及其电子封装技术的迅猛发展,电子产品及其贴装技术要求PCB板的表面处理技术具有高温可焊性、无铅化、无卤化等特性。有机可焊保护剂(OSP)因其具有工艺