噪声鲁棒性的语音转换算法

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:dududi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是语音信号处理领域的一个重要分支,具体说来,语音转换即是保持语音中的语义不变,仅改变说话人的个性信息,使之听起来像特定说话人的声音。语音转换的研究包含语音信号处理的各个方面,如特征提取,特征对齐,语音合成等,对于语音转换的研究也有利于促进其它领域的发展,对人类了解语音信号的本质具有非常重要的作用,同时语音转换的研究也有很多的实际应用场景,如保密通信,定制个性化声音等。在语音转换迈向实际应用中,噪声对于语音转换的干扰是非常严重的,本文针对含噪语音难以实现有效的语音转换,在非负矩阵分解算法的基础上,提出联合字典优化的噪声鲁棒性语音转换算法(BE-NMF),使得含噪语音与联合字典匹配,从而实现语音转换与语音去噪相结合,实现噪声环境下的语音转换;同时结合后向剔除算法对联合字典中无效原子的剔除作用,横向减小联合字典的大小,在保持转换性能基本不变的情况下提高转换效率。在多信噪比和多种噪声的条件下的对比实验表明,本文BE-NMF算法相较于传统NMF算法和经过谱减消噪预处理的NMF算法具有更高的转换效果,同时后向剔除算法也在一定程度上提升了转换的效率。针对单帧特征转换所引起的转换语音的不连续性问题,在BE-NMF算法基础上引入上下文信息,通过多帧构造一帧形成超帧的方式解决,随之通过Mel滤波的方式纵向降低超帧维数,降低计算复杂度;结合语音信号的特点,将语音信号通过谐波冲激分解算法分解为谐波部分和冲激部分,并对两部分信号分而治之,对含有个性信息的谐波部分进行转换,对不含有个性信息的冲激部分,进行维纳滤波处理,对谐波信号部分进行补偿。实验研究表明:仅对谐波信号部分进行转换,能够提高转换的客观评价质量,冲激信号部分的补偿作用对语音的主观听觉质量有明显的提升作用;另外上下文信息的引入,也在一定程度上提升了转换质量,通过Mel滤波处理的方式虽然同帧数情况下转换质量有所降低,但是其转换速度在帧数为9时提升个5倍左右,因此可以牺牲一定的转换效果提升转换速度,这对于实际应用具有非常可观的作用。
其他文献
要提高幼师师生钢琴弹奏的水平和钢琴教学的质量,必须从创设环境、激发兴趣着手,以重视听力训练为基础、强化基本功训练为辅,努力培养学生正确、科学的练琴方法。
伴随者计算机技术不断深入,数字地面模型(DTM)的数据获取方法、数据存储和数据处理速度等方面取得突破性进展,基于数字地面模型方面的产品越来越广泛的用来代替传统地形图对
从爆炸产生的原因着手,通过不同的评价和计算角度分析常见的炼油装置存在的爆炸危险,从而识别装置中的爆炸危险所在,并从安全设计和安全管理方面阐述了应采取的防范措施。
以闭式循环高压补燃液氧/煤油液体火箭发动机的燃气发生器为研究对象,采用了SIMPLEC方法和非结构性网格技术对其燃烧室进行了三维燃烧流场的稳态数值模拟,其中湍流采用RNG k-
电声课程是教育技术专业中一门实践性很强的专业基础课,实验教学对学生验证、理解课堂讲授的知识、运用知识分析解决实际问题有着重要作用.要培养高素质的电声人才,实验教学
近年来随着电商产业的快速发展,“互联网+”和物流行业的融合已经成为我国未来物流业发展的大趋势。但是,快递物流业的发展速度与消费者对快递服务的高质量要求并不完全匹配
自恋者面对不公正事件的情绪反应与应对策略,可以通过公正敏感性反应出来。本研究自编《大学生自恋人格问卷》,探究大学生自恋人格特点的差异性及其与公正敏感性的关系。研究一编制《大学生自恋人格问卷》。共34个项目,分为控制欲、防御性、归属感三个维度。对15位在读研究生进行访谈,预测阶段共发放220份问卷,回收有效数据样本197份。经数据分析证实,该问卷信效度良好。研究二为正式问卷施测阶段。探究大学生自恋人