基于神经网络的语音转换算法研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:xiaoxianjihuoma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换技术是一种将源说话人的声音变为目标说话人声音的技术。作为一门交叉性较强的学科,语音转换技术目前已在文语转换、医疗辅助和通信保密等方面已经得到了重要应用,并且在其他领域展现出了广泛的应用前景。语音转换的研究不仅能加深信号处理领域的理论发展,而能够加深其他与之交叉领域的研究进展。因此,语音转换技术的研究在各个方面都表现出了重要的意义。目前进行语音转换时使用最多的模型是高斯混合模型(Gaussian Mixture Model,GMM)和人工神经网络模型(Artificial Neural Networks,ANN)。考虑到GMM模型存在过平滑和过拟合等问题,论文选用ANN模型进行语音转换。ANN中的径向基函数神经网络(Radial Basis Function,RBF)模型结构简单,可以逼近任意非线性函数。而广义回归神经网络(Generalized Regression Neuron Network,GRNN)作为RBF的一种特例,其模型具有很强的非线性映射能力、简单的网络结构和较高的鲁棒性。针对GRNN模型有且只有一个模型参数的特点,本文利用粒子群优化算法(Particle swarm optimization,PSO)对其进行参数优化,得到了PSO-GRNN模型。该模型不但可以减少人为参数选择对转换模型的影响,还可以提高网络的学习能力。因此,论文中使用的ANN模型有RBF模型、GRNN模型和PSO-GRNN模型。实验结果表明,基于PSO-GRNN模型的转换语音比基于RBF模型和GRNN模型的转换语音更接近目标语音。线性预测编码(Linear Prediction Coding,LPC)模型在语音信号分解时对鼻音和爆破音描述的准确率不高,而STRAIGHT模型可以将语音信号分解得到彼此独立的频谱参数和基频参数,并对这些参数进行语音重构。故本文使用STRAIGHT模型代替LPC模型对语音信号分解和合成,并进行了相应的语音转换实验。相似度测评结果表明,基于STRAIGHT和PSO-GRNN模型的转换语音比基于LPC和PSO-GRNN模型的转换语音更接近目标语音。
其他文献
<正> 中国美协和承德地区群艺馆联合举办的“送画下乡”展销会,春节前夕,在河北省丰宁和滦平两个县城的农贸集市上,先后进行了展销活动。这次展销,旨在探索美术如何为八亿农
期刊
<正> 一、新概念是在打破旧概念中形成的 modern design 一词释成汉文是“现代设计。”在日语中,原来也是把design一词意释为意匠、设计、图案等,但是由于现代设计这一新艺术
本研究以广州市1700名3岁~6岁幼儿家长为对象,对3岁~6岁幼儿的气质和父母教养方式进行调查,结果发现:广州市3岁~6岁幼儿在注意分散度上性别差异显著,男孩的注意更易分散;独生子女和非
小提琴初级阶段的教学具有着音准和发音的双重困难,因此,在小提琴初级阶段的教学中,教师无论是在演奏姿势、音准、"节奏组合"、音乐表现能力等等各个方面都应该严格地、规范
家园共育是幼教实践的重大课题,良好的家园沟通是实施家园共育的基础,本研究在学界以往对家园沟通研究的基础上,探求改善家园沟通的策略,不以改变家园双方为目的,注重沟通中存在的
4月17日,备受瞩目的2007年春季英特尔信息技术峰会在中国北京国际会议中心拉开序幕。来自英特尔公司总部及中国区的高级管理人员、资深院士以及技术专家云聚北京,与来自世界各
本文对一种经济型电流源逆变器的主电路进行计算机仿真研究。该经济型电流源逆变器采用一只 GTR 控制逆变器,六个晶闸管换流,主电路结构简单,换向可靠,成本低廉。本文从工作
浙江景兴纸业股份有限公司是全国规模最大的三家以专业生产A级牛皮箱纸板为主的造纸企业之一。公司主导产品为低克重高强度牛皮箱纸板(完全可以取代进口纸)、白面牛卡、高强度
通过调查万州区烤烟和白肋烟种植区域黑胫病发病情况,记载相关的田间环境条件,分析探索不同因子的影响作用和黑胫病发病规律,为开展农业综合防治,减少病害发生和危害,挽回烟