藏语拉萨方言的统计参数语音合成的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:zjkghost10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机语音交互技术的快速发展,目前的文-语转换(Text-to-Speech, TTS)系统可以合成出高可懂度和高自然度的合成语音,获得了广泛的应用。在我国,汉语普通话、粤语等语言的TTS技术已经越来越成熟,被应用到教育、通讯等多个领域。但尚缺少面向少数民族语言和方言的TTS系统。中国是一个多民族的国家,有多种少数民族语言和方言。藏族作为中国古老的少数民族之一,有自己的语言文化。本文以藏语拉萨方言为研究对象,设计了藏语拉萨方言的文本语料,录制了语音语料,提出了一种藏语拼音的机读音标的设计方案SAMPA-T(Tibetan),实现了藏语文本到SAMPA-T的转换,在此基础上,实现了藏语拉萨方言的统计参数语音合成。论文的主要工作和创新如下:1.设计了一个藏语拉萨方言的语料库。通过分析藏语拉萨方言在声、韵、调上的特点,结合《藏语方言调查字表》,设计了藏语拉萨方言的文本语料,包含600个单音节词、400个双音节词和1000句语句。录制了藏语拉萨方言语音语料。语料库既能用于藏语方言的实验语音学研究,也能用于藏语方言的言语工程研究。2.设计了一种藏语拉萨方言的SAMPA-T(Tibetan)标注方案,提出了一种面向藏语机读音标SAMPA-T的字音转换算法,实现了藏语文本语料的SAMPA-T的自动标注。3.实现了藏语拉萨方言的说话人相关的统计参数语音合成。根据藏语拉萨方言的发音特点,设计了上下文相关的语料标注格式和用于决策树聚类的问题集,标注了语料的上下文相关信息,计算了语音数据的广义mel倒谱系数。以声韵母为基元,利用基于隐马尔可夫模型(Hidden Markov Model, HMM)的统计参数语音合成技术,训练获得了说话人相关的声学模型,实现了说话人相关的统计参数语音合成,并对合成语音进行了自然度的评测。实验结果表明,合成语音的平均MOS得分为3.7。
其他文献
目的:探讨SBAR沟通模式在急诊危重患者院内安全运转中的应用方法及效果。方法:将实施SBAR沟通模式前62例急诊危重患者作为对照组,院内运转交接过程中采用常规运转模式。将实
闭合性阴囊损伤多属临床急症,处理不当可导致性功能障碍甚至不育,早期的诊断和及时有效的外科处理,在临床工作中尤为重要。现将收治的闭合性阴囊损伤41例患者,就诊断及治疗进行探
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的了解临床护理骨干评判性思维能力现况,探讨影响因素,为临床护理人员培训提供依据。方法采用中文版评判性思维能力测量表(CTDI-CV)对广东省52所医院、湖北省34所医院共260名
目的:探讨针灸配合刺络放血治疗面瘫的临床效果。方法:32例面瘫患者,随机分为对照组与观察组,各16例。对照组选择中药治疗,观察组选择针灸配合刺络放血治疗。比较两组患者临床
目的探讨医护一体化护理联合经颅磁刺激对颅脑肿瘤患者治疗依从性及日常生活能力的影响。方法回顾性分析2018年1月至2019年7月于医院接受颅脑肿瘤手术的120例患者的临床资料,
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的探讨复方丹参滴丸联合依达拉奉在断肢再植后缺血再灌注损伤(IRI)中的应用。方法选取2017年1月至2019年9月断肢再植后IRI患者156例作为研究对象,随机分为对照组和观察组,
白城师范学院是吉林省西部唯一的一所普通高等学校,学校的前身是白城师范专科学校,始建于1958年,现已发展为一所以师范教育专业为主、非师范专业为辅的地方性、综合性本科院校。
早在党的十七大报告中,就提出了生态文明的概念,随着社会的发展进步和民众思想认识的提高,生态文明已逐渐成为热议焦点。高职院校的思政教育在生态文明建设中有着至关重要的