基于深度学习的无线通信(FM)语音增强的研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:lsgaoyan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
调频调制是无线通信中常用的调制方式之一,它广泛的应用于卫星通信、蜂窝电话的系统、高保真的音乐广播等。但是当接收到的调频无线电信号较弱,信噪比较低时,传输过程中受到诸多畸变,会对接收端的语音的质量产生较大的影响。针对以上诸多畸变对无线通信语音信号的影响,为了保持可靠的无线电通信,同时为了降低传输过程中的诸多不确定性因素对调频语音信号的影响,设计一个高效及鲁棒的无线通信语音信号增强模型具有十分重要的意义。传统方法虽然针对每种畸变都有相应的解决办法,但是当需要同时处理信号传输过程中遇到的所有畸变时,则需要多种解决办法协同合作,实现起来较为复杂。而且当信道环境较差时,无法保证信号质量。本文引入了基于深度学习的语音增强方法,我们使用的深度学习的方法可以在无线通信接收端使用训练好的神经网络模型一次性同时解决多种畸变对语音质量的影响,即提高了增强后的语音质量,同时在面对恶劣的信道环境的情况时更加的灵活可靠,仍然可以保证接收端的语音质量。该方法可以有效的克服传统方法的缺点,同时可以达到更好的增强效果。本文针对使用基于深度学习的语音增强方法对无线通信接收端的语音进行增强的研究主要处理了以下两个问题:1、基于深度学习的方法要想有效的运行,首先要准备大量的可靠的数据集。本文结合了无线通信领域的通信信道的仿真模型,在开源数据集的基础上仿真了用于训练基于深度学习的无线通信语音增强模型的语音数据集。该数据集包含30多万条接近真实情况的仿真语音,使训练出的最好模型可以在仿真数据集上以及实际情况的无线通信语音上均取得一定的提升。其中在仿真数据集上PESQ和STOI分别提升了1.91和22.51%,在真实数据的频谱图上也可以看出对语音质量有一定的提升。2、本文借鉴了近几年基于深度学习的频域和时域的语音增强的三种网络结构及方法,并使用自己仿真的30多万条语音的数据集,共计训练了九个网络模型。通过模型测试结果可以对比出目前哪一类的基于深度学习的方法最适合无线通信语音增强任务。同时通过在真实采集的数据上进行测试,验证了本文使用的基于深度学习的无线通信语音增强的方法的可行性以及实用性。
其他文献
Fortran语言一直被广泛用于解决科学和工程中的计算密集型问题。由于多核架构的出现,追求Fortran的并行性成为科学计算领域中的一个重要目标。然而在大数据时代,多核架构由于计算资源不足和可扩展性差,导致多核并行后的Fortran程序仍然无法适应数据的爆炸式增长。云计算作为一种商业计算模型,不仅具有丰富的集群计算资源,而且具有理想的灵活性和可伸缩性,这为解决多核并行领域中计算资源不足等相关研究问
学位
多核苷酸激酶/磷酸酶(polynucleotide kinase/phosphatase,PNKP)能催化γ-磷酸基团从核苷三磷酸转移到DNA或RNA的5′羟基末端,导致核酸磷酸化,而核酸磷酸化对DNA损伤修复起关键性作用。噬菌体T4 PNKP是PNKP研究中的典例,也是分子生物学中最常用的酶之一。噬菌体T4 PNKP具有5′激酶和3′磷酸酶活性,分别介导磷酸化和去磷酸化反应,并且反应可同时进行。
学位
随着汽车行业和通信技术的飞速发展,车联网技术也得到了快速发展。智能化车辆的出现以及智能化服务的普及导致人们对服务需求的类型和数量也不断增多。由于车辆自身硬件配置的限制,无法满足计算密集型复杂车辆应用处理的资源需求和低时延需求。边缘计算的提出有效的解决了上述问题,同时也产生了边缘资源滥用的新问题,不合理的边缘资源分配方案导致边缘服务器的资源利用率不高。特别是对一些需要多服务器联合才能处理的复杂任务,
学位
急性T淋巴细胞白血病(T cell acute lymphoblastic leukemia,T-ALL)是一种免疫表型高度异质性的血液系统恶性克隆性疾病。基因组DNA甲基化修饰变化是T-ALL重要的表观遗传学调控方式,在正常和肿瘤细胞中维持稳态。近年研究证实,在T-ALL发生发展进程中DNA甲基化转移酶DNMT家族和去甲基化酶活性的TET蛋白家族持续动态调节各亚型细胞群,维持异质性特性中发挥重要
学位
近些年来,知识产权保护越来越受到世界各国的重视。专利作为知识产权的一种重要形式,数量在逐年增加。为了更好地使用数量愈加庞大的专利,首先需要理解专利的问题。专利的问题包括两个方面,即专利文本中的问题句和专利问答中对专利的提问。专利作为一种复杂的科技文本,是围绕问题句进行展开的。因为问题句描述了专利所要解决的问题,所以识别问题句是专利问题理解的关键。目前,通过计算机识别专利中的问题句面临着专利问题句相
学位
随着业务规模与需求的变化,传统单体系统架构开发效率低、维护成本高、扩展能力弱等问题凸显。微服务架构具有混合开发、灵活扩展、便于维护等特点,将遗留系统重构为微服务架构可以提高软件系统开发运维效率、提升系统可扩展性。但是,在微服务重构的过程中面临诸多挑战,数据库拆分就是其中需要重点解决的问题。不对数据库拆分或者拆分不当将导致重构后的系统性能下降、可用性降低。本文针对微服务重构过程中的数据库拆分问题,提
学位
股票预测是学术界近年来热点研究之一,但股价波动受多种因素影响,预测难度较大。政策作为国家长期发展规划,保障着证券市场的平稳运行,股市固有的提前预期特性使得国家政策变动必然会反映到股市活动中,故挖掘政策因素的影响可为投资者提供有效参考信息。历来很多文献致力于研究政策与股票市场波动的关系,但仍存在两个不足:一是针对政策内容的分类标准较少,且研究人员在对政策进行分类时多采用人工标注方法,分类成本较高;二
学位
我国内蒙古地区以察哈尔蒙古语为蒙古语标准语,蒙古国以喀尔喀蒙古语为蒙古语标准语。随着各类手机智能助手以及智能家居的普及,人机交互成为了研究热点。语音识别技术是人机交互中必不可少的一个环节。目前,英语、汉语、德语等语言语音识别系统已经达到了使用要求,但是基于喀尔喀蒙古语的语音识别研究仍处于初级阶段。为了推进蒙古语智能语音技术发展,本文根据喀尔喀蒙古语特点研究了基于深度学习和迁移学习的喀尔喀蒙古语语音
学位
水平基因转移(Horizontal Gene Transfer,HGT)事件广泛存在于自然界中,它帮助受体物种绕过突变及重组获得新基因,加速基因组革新进程,所以准确识别HGT事件是探究物种之间真实演化关系的重要一环。由于发生转移的基因位置倾向于通过谱系保留,因此可依据基因树与物种树之间拓扑结构不一致性对HGT事件的识别进行研究。RIATA-HGT算法是目前有效识别HGT事件的算法之一,但该算法对于
学位
内蒙古历史作为中华民族历史沃土中的一颗璀璨明珠,有着悠久的文化传承。目前历史的记载都是厚重的文本,非专业人士梳理和理解语义关系难度较大。其实RDF(Resource Description Framework,资源描述框架)用三元组集合的方式来描述客观世界事物和关系的思想满足用简单的二元关系模型描述历史知识事物关系的需求。RDF作为一种元数据语言,其三元组表达形式包含语义信息,且不受具体语法表示的
学位