兰州方言语音生成方法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:henban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了利用语音转换实现兰州方言语音的生成方法。在采用Pitch Target估计模型为声调模型的基础上,提出了采用线性修改模型(LMM)生成兰州方言的方法和采用高斯混合模型(GMM)生成兰州方言的方法。论文还提出了在生成方言语音的基础上采用语音修改方法实现音色可变兰州方言的方法。论文的主要工作及贡献如下:1.提出了兰州方言的声调表示方法。在声调模型的选择上,论文讨论了现今主要的声调模型。根据兰州方言语音的特点选择语音学模型中的Pitch Target估计模型作为声调表示模型。2.提出了一种基于线性修改模型(LMM)的兰州方言生成方法。对于训练集中的普通话语音和兰州方言语音利用Pitch Target估计模型提取特征参数,分别用七维的矢量表示两种语音的声调曲线,然后利用线性回归的方法分别求得七个特征参数的转换函数。在生成语音时,首先提取待转换普通话的七个特征参数,然后利用转换函数计算出兰州方言对应的七个特征参数,生成基频F0曲线,最后利用Straight算法合成方言语音。3.提出了基于高斯混合模型(GMM)的兰州方言变换方法,使得能够在大语料库的基础上,基于统计学模型,实现普通话到兰州方言的变换。首先利用Pitch Target模型提取源语音和目标语音的特征参数,构建方言变换的训练集;然后构建普通话和兰州方言训练语音库,训练出GMM的转换参数。根据转换参数进行方言变换,得到兰州方言的F0曲线,最后利用Straight算法合成出兰州方言。实验结果表明,增加训练音库的规模,可以得到质量更好的合成语音。4.提出了音色可变兰州方言语音的生成方法。影响语音听感的参数,主要包括时域和频域参数:基频、时长、非周期指数和频谱。利用Straight语音修改算法修改方言语音的基频、时长等时域参数和共振峰等频域参数,可以得到音色可变兰州方言语音。实验结果表明,该方法能够得到较高质量的多音色兰州方言语音。
其他文献
随着信息技术、计算机产业以及互联网技术的迅速发展,嵌入式系统(Embedded System,ES)成为了当前IT产业最瞩目的焦点之一。基于嵌入式的远程数字视频监控系统是当前嵌入式应
本文采用溶胶—凝胶法制备了锰酸盐La_(0.7)Sr_(0.3)MnO_3(LSMO)粉料。将该粉体加压制成柱状并热压。热压后的样品进一步在1573k温度下烧结以得到致密的LSMO样品。PZT粉末压片,烧结,切割后极化,并在其表面固银生成电极。将制得的LSMO薄片其与PZT薄片用缓干型坏氧基树脂及硬化剂胶合得到所需多层膜样品。用X射线衍射方法表征了LSMO样品的结构。用SEM观察了LSMO样品的形
随着人类社会的不断发展,复杂网络理论知识越来越广泛的应用到社会的各个领域。在复杂网络研究中,网络拓扑学拓展了人们对复杂系统的认识,而网络动力学则更深入地刻画了复杂
混沌是在确定系统中发生的貌似随机的无规则或不规则的运动。混沌信号以其拥有的诸多天然优良特性而备受关注(比如对初始条件的敏感性、貌似随机的行为和连续宽带功率谱等),
在铁电随机存储器(FeRAM)中,信息存储在铁电薄膜的极化方向中,由极化翻转电流读取信息。这就要求铁电薄膜具有以下特征:剩余极化强度值Pr要大,以便从小面积电容上可以得到较大的极化翻转电流;矫顽电场Ec要小,以使FeRAM可以在低电压下操作;疲劳和印迹要小,疲劳指多次翻转后剩余极化强度变小,而印迹指在两个方向上极化不对称。至今为止,在上述FeRAM要求的条件下,已经有多种铁电材料被研究。其中,主要