序列到序列的藏语拉萨话语音合成研究及实现

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:rockonfire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,信息科技飞速发展,人工智能智能发展方兴未艾。语音处理技术在新时代的推动下,取得了令人夺目的成绩。语音合成技术经历了从最初的机械、电子器件的语音合成,到后来的基于参数统计、波形拼接、深度学习等方法。近两年,端到端技术开始兴起,该技术在语音合成上实现从训练到合成都是同一个模型,旨在从一端的输入直接输出到模型的另一端。序列到序列就是其中一个经典的技术,序列到序列的语音合成实现了从输入文本到直接输出波形文件。在研究藏语拉萨话音合成技术背景的基础上,阐述了语音合成技术和藏语语音合成的发展历程,研究藏语语音合成技术的理论并进实现。分析了目前藏语语音合成技术发展的现状和之后需要改进的方面,通过应用序列到序列的模型结构实现藏语拉萨话的语音合成。该技术合成的语音相比较于真人的语音,合成语音在听感上有一定相似度,减少了以往技术存在的卡顿、不连续等现象,在韵律反面也更符合人的听感舒适度,自然度上相比较于传统的HMM和DNN-HMM的语音合成技术也有所提高,达到了MOS评分3.92的自然度和4.20的相似度。通过与汉语实验对比,分析了藏语语料应该改进的方面。序列到序列的藏语语音合成研究的最大优点是它节省了大量的前端文本处理、文本语音的对齐工作和时间成本,它在一定程度上促进了语音合成技术的广泛应用,为计算机研究人员开辟了一条可以涉及其他不同语言研究领域的研究道路,从而实现更多交叉领域的研究成果。
其他文献
三价稀土离子掺杂的无机纳米晶和全无机金属卤化物钙钛矿量子点由于其优异的发光性能、可控稳定的合成方式以及多样化的结构设计在高功率激光、光通讯、照明与显示、节能环保
本文以已有的零形回指研究成果为理论基础,采用定量分析、偏误分析和对比分析等研究方法,选取了北京语言大学HSK动态作文语料库中200篇高级水平韩国学生作文语料(约89000字),
相比于传统的闪存存储器(Flash),铁电存储器(FRAM)因其高读写速度、低功耗、高保持特性以及高耐久性,被广泛认为是具有发展前景的一种非易失性存储器。然而Pb(Zr,Ti)O3(PZT)、Bi4Ti3O
当代城市山水画在传统艺术理念和现代城市化进程之中蓬勃发展,是中国山水画参与当下生活、表达时代精神的当代表现形式。当代画家将传统文人画中蕴含的笔墨精神与现代艺术观
本次翻译材料来源于《心智的五大核心——重设教育以适大脑》(Five Pillars of the Mind:Redesigning Education to Suit the Brain)的前四章。本书属于教学法方面的著作,主
访谈是实用性文本的常见形式之一,是获取信息的一种重要方法。随着各国间经济文化等各方面的交流日益频繁,对访谈类文本的翻译研究也越来越多。本次实践旨在通过对《对话张勇
东乡隶属江西东部抚州市,其方言是赣方言抚广片的代表。本文考察东乡方言的被动标记词“被”“得”“驮”“是”的句法语义特征,分析该地区有标被动句特点,从类型学的角度探
近几年人工智能的发展日益迅速,越来越多地应用在人们生产生活的各个方面,极大地改变了人们的生活方式,推动了社会发展。本实践报告基于两篇科技论文的英汉翻译,均与人工智能
现代汉语中的关联词语是复句中用来联结分句、标明分句间关系的词语。关联词语的正确使用能够帮助留学生更好地学习复句、进行成段的语篇表达,对于提升留学生的整体语言表达
光纤作为材料的一维形态,是优异的光学研究和光学器件平台,极大地促进了科技与社会的发展进步。伴随着功能材料的研发升级和光纤制备工艺的不断精进,涉及材料、结构或功能集