东干语语音合成的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:hh0745cn12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成作为人机交互中的重要组成部分,随着语音合成的愈发成熟,目前已经能够合成出高自然度的汉语普通话语音。同时,随着机器学习的发展语音合成受到了越来越多的关注并成功应用到众多领域。除汉语普通话、英语等主流语言,近些年来对民族语言和方言的合成关注也越来越多。通过对民族语言和方言的语音合成研究,有效地提高了语音交互的多样性。中国地域辽阔,民族众多,因此在不同地区人们除了使用汉语普通话外还存在着丰富的方言和民族语言。东干语是东干族的民族语音。东干语来源于清代晚期的近代汉语西北方言,属汉藏语系汉语语支,主要分布在中亚地区,是汉语陕甘方言在中亚地区的特殊变体。本文以东干语陕西支为研究对象,提出了基于隐马尔可夫模型(Hidden Markov Model,HMM)的东干语语音合成方案和基于深度神经网络(Deep Neural Networks,DNN)的东干语语音合成方案,实现了东干语的语音合成,并对合成结果进行了对比分析。论文的主要工作和创新如下:1.创建了东干语语料库。本文通过对东干语的声韵母、词汇、句型等语言特征和基频、声调等语音学特征的分析,建立了一个共2000句的东干语语料库。该语料库覆盖了东干语的所有声母、韵母、声调、常用词汇和句型。语音语料由以东干语为母语的东干族留学生进行录制。2.设计了一套针对东干语的机读音标方案(Speech Assessment Methods Phonetic Alphabet for Dungan,SAMPA-DG)。通过对东干语的声韵母、声调、声韵配合关系等特点进行分析设计得到SAMPA-DG,将输入的文本转换为可被计算机识别的音标。并定义了适用于东干语的上下文相关标注格式,用来实现东干语语境信息的标注。3.文本提出了基于HMM的东干语语音合成方案和DNN的东干语语音合成方案,合成得到东干语语音。从实验结果上来看,当东干语训练语料数较小时,基于HMM的东干语合成的效果较好,随着训练语料的增加基于DNN的东干语语音合成效果逐渐提高并优于基于HMM方法合成的东干语语音。
其他文献
玉米是全球范围内重要的粮食、饲料和工业原料作物,土壤盐碱化极大地影响了玉米的生长和最终产量,miRNAs是植物生长发育和逆境应答过程的关键调控因子,但miRNAs参与玉米高盐
随着移动通讯技术的迅速发展和社会信息化程度的逐渐提高,无线网络技术在信息处理及信息交换等场景中得到广泛应用。移动网络及智能移动终端设备已成为人们生活和工作中不可
冷却塔在火力发电中有着非常重要的作用,随着社会的进步和工业的发展,冷却塔的体型越来越大,结构形式越来越复杂,混凝土材料的缺陷表现的越来越突出,而钢结构冷却塔具有自重
随着社会的不断发展,工业也得到迅速的发展,伴随着工业的发展而带来的一系列环境问题越来越受到了人们的关注。其中,化妆品制造、皮革处理、金属部件镀铬等工业可能带来的Cr(
单木结构参数反映了森林生长趋势以及健康状况,对森林的经营管理有着重要意义。传统的单木结构参数测量方法费时费力,因此本研究引入近景摄影测量技术,目的是更加方便快捷的
目前模式识别技术在各个领域中得到应用。手语识别技术、人脸表情识别技术以及情感语音合成技术都得到了很好的发展。但是目前大多是对手语识别、人脸表情识别以及情感语音合
本文基于国家自然科学基金面上项目“山地城市大跨度悬索桥主梁截面的气动导纳函数研究”(项目编号:51778193),采用主动控制风洞试验与CFD数值模拟相结合的手段分别研究了流
无论是工作还是生活,追寻其规律都会让其变得简单。同理,教学也是一样的。摸索规律才会让教学变得更为科学。在授课的过程中,通过学生的实际反馈来更新教学方式方法,这是生成
随着我国经济的快速发展,城市化水平持续升高,各地区均大力发展基础建设,大量建设地铁、高铁穿过的综合性航站楼。基于航站楼对于舒适性、安全性及大空间的需求,层间隔震体系
分数阶微分方程是近几十年来的研究热点。由于分数阶具有更好的数据拟合效果,它的理论水平和应用价值都在不断的提升。本文主要聚焦分数阶微分方程边值问题中,带有积分项的边