藏语语音合成关键技术研究

来源 :西藏大学 | 被引量 : 0次 | 上传用户:undeadmoon01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成系统包括三个主要的组成部分:文本分析模块、韵律生成模块和声学模块。本文也是从以上三方面着手分别研究了文本预处理中的藏文分词技术,韵律标注规则和韵律标注内容,韵律标注时所需藏文拉丁转换算法实现,语音处理后端合成所需的问题集的设计。本文所做的主要工作如下:1、本文对藏文分词中所用格助词的兼类问题做了比较深入的研究。藏语格助词是一个比较明显的词边界,作为边界标记它有利于藏文分词。对“八格”以外的格助词的兼类现象加以形式化的描述和研究,这对进一步开展藏文分词提供了有效的策略和途径。2、语音合成的核心主要有文本分析和韵律控制来体现,其中文本分析是语音合成的基础,它主要包括特殊符号的转换和文本中词的切分等。而自动分词的准确程度,即准确率将会严重影响到输出语音流的自然度和清晰度,是文本分析系统的核心内容。故本文对藏文分词算法进行了系统的研究,并实现了正向和逆向的最大匹配藏文分词算法。由于这两种算法不具有未登录词的识别能力,故在此基础上提出了基于标记的归一化的藏文分词算法,该算法对未登录词具有较好的识别能力。3、在基于语料库语音合成技术中语音语料库的构建占有非常重要的地位,它是语音合成系统的基础和关键,其中对言语标注方面,本文在建设语音语料库时制定了相应的语料标注规则,并对标注所用拉丁转写,通过藏文拉丁转换算法加以实现,该算法具有良好的移置性和复杂度低等特点。4、本文通过对拉萨语系的研究,设计了上下文属性(则需要综合考虑所有参数的变化特性),确定了藏语语音合成问题集所要考虑的因素,这对藏语语音合成系统的实现打下了良好的基础。
其他文献
1999年5月8日,以美国为首的北约悍然用导弹袭击中国驻南斯拉夫联盟大使馆,造成3人死亡,20多人受伤,使馆建筑被严重毁坏。这是对中国主权的野蛮侵犯,是对维也纳外交关系公约和
量词在汉语中作为一个独立的词类,通常表示人、事物或动作的单位,结合数词具有计量功能,特定的量词与特定意义的词具有常规搭配关系。但在实际语言尤其是文学作品中,量词搭配
阐述了织金县新华磷矿大戛矿段地质背景和特征,在对区域地质的研究基础上,通过对矿体形态特征、矿石结构构造、成分分析,总结出该地区成矿条件,矿体往深部还有较大延伸空间,
时代的进步,传播技术的迅猛发展,互联网对社会经济、政治、文化的深刻变革,显现了既有政治传播的缺陷和不足,促使我们积极应对挑战,努力把中国特色的政治传播提升到与中国特
术语是知识体系的核心成员,是学科知识的集中体现,通过术语了解学科发展动态是一种行之有效的方法。术语提取技术是大规模本体工程自动或半自动构建、扩充的关键技术之一。近
研究目的:本研究利用慢性非缓解型小鼠实验性变态反应性脑脊髓炎(EAE)模型和小胶质细胞体外培养模型,探讨小胶质细胞活化在慢性EAE轴索损伤中的作用机制,以及米诺环素的炎症
随着空间交会对接和编队飞行技术的发展与应用,航天器近距离相对运动成为当前航天领域的研究热点与前沿。预计今后航天器近距离相对飞行将成为空间活动的日常形式。论文以航
在已有研究资料的基础上,使用Landsat 5 TM遥感影像,利用遥感影像处理软件ERDAS分析了大比例尺(植被型)的植被类型,计算了主要植被类型的面积,并与前人所做工作进行了比较。
<正>1.故障现象1台用于露天矿山开采的100t级大型矿山液压挖掘机动臂下降时出现抖动现象,有时动臂无法顺利下降。动臂下降时的抖动带动整机晃动,使操作人员感觉不适。现场调
对Zr基大块非晶合金熔体在铜模中的流动能力进行了理论和实验研究,给出了影响金属熔体在型腔中流动行为的主要因素,为金属熔体快速冷却过程中克服充型和形成非晶态的矛盾奠定