基于神经网络的语音转换算法研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户：xiaoxianjihuoma

【摘要】

：

语音转换技术是一种将源说话人的声音变为目标说话人声音的技术。作为一门交叉性较强的学科,语音转换技术目前已在文语转换、医疗辅助和通信保密等方面已经得到了重要应用,并

【作者】

：

杨秀峰

【出处】

：

西安建筑科技大学

【发表日期】

：

2017年期

【关键词】

：

语音转换广义回归神经网络 PSO算法 LPC模型 STRAIGHT模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音转换技术是一种将源说话人的声音变为目标说话人声音的技术。作为一门交叉性较强的学科,语音转换技术目前已在文语转换、医疗辅助和通信保密等方面已经得到了重要应用,并且在其他领域展现出了广泛的应用前景。语音转换的研究不仅能加深信号处理领域的理论发展,而能够加深其他与之交叉领域的研究进展。因此,语音转换技术的研究在各个方面都表现出了重要的意义。目前进行语音转换时使用最多的模型是高斯混合模型(Gaussian Mixture Model,GMM)和人工神经网络模型(Artificial Neural Networks,ANN)。考虑到GMM模型存在过平滑和过拟合等问题,论文选用ANN模型进行语音转换。ANN中的径向基函数神经网络(Radial Basis Function,RBF)模型结构简单,可以逼近任意非线性函数。而广义回归神经网络(Generalized Regression Neuron Network,GRNN)作为RBF的一种特例,其模型具有很强的非线性映射能力、简单的网络结构和较高的鲁棒性。针对GRNN模型有且只有一个模型参数的特点,本文利用粒子群优化算法(Particle swarm optimization,PSO)对其进行参数优化,得到了PSO-GRNN模型。该模型不但可以减少人为参数选择对转换模型的影响,还可以提高网络的学习能力。因此,论文中使用的ANN模型有RBF模型、GRNN模型和PSO-GRNN模型。实验结果表明,基于PSO-GRNN模型的转换语音比基于RBF模型和GRNN模型的转换语音更接近目标语音。线性预测编码(Linear Prediction Coding,LPC)模型在语音信号分解时对鼻音和爆破音描述的准确率不高,而STRAIGHT模型可以将语音信号分解得到彼此独立的频谱参数和基频参数,并对这些参数进行语音重构。故本文使用STRAIGHT模型代替LPC模型对语音信号分解和合成,并进行了相应的语音转换实验。相似度测评结果表明,基于STRAIGHT和PSO-GRNN模型的转换语音比基于LPC和PSO-GRNN模型的转换语音更接近目标语音。

其他文献

浅谈小提琴初级阶段的教学

小提琴初级阶段的教学具有着音准和发音的双重困难,因此,在小提琴初级阶段的教学中,教师无论是在演奏姿势、音准、"节奏组合"、音乐表现能力等等各个方面都应该严格地、规范

期刊

小提琴初级阶段教学

2007年英特尔信息技术峰会在北京举行——多重动力，携手创新

4月17日，备受瞩目的2007年春季英特尔信息技术峰会在中国北京国际会议中心拉开序幕。来自英特尔公司总部及中国区的高级管理人员、资深院士以及技术专家云聚北京，与来自世界各

期刊

英特尔信息技术峰会北京国际会议中心多重创新高级管理人员IT技术英特尔公司技术专家

经济型电流源逆变器主电路的计算机仿真研究

本文对一种经济型电流源逆变器的主电路进行计算机仿真研究。该经济型电流源逆变器采用一只 GTR 控制逆变器,六个晶闸管换流,主电路结构简单,换向可靠,成本低廉。本文从工作

期刊

电流源逆变器晶闸管换流计算机仿真

重庆万州区烟草黑胫病发病情况调查及综合防治效果

通过调查万州区烤烟和白肋烟种植区域黑胫病发病情况,记载相关的田间环境条件,分析探索不同因子的影响作用和黑胫病发病规律,为开展农业综合防治,减少病害发生和危害,挽回烟

学位

重庆万州烟草黑胫病调查综合防治

基于神经网络的语音转换算法研究

其他学术论文