实用化的粤语语音合成系统研究与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ylm1982123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多语种的语音合成研究是近年来国内外语音合成研究的一个热点.实现多语种的语音合成,包括方言、少数民族语言的合成,也是国内汉语语音合成研究的一个重要研究方向.粤语作为一种强势的方言,其特殊地位及潜在的市场价值以及目前国内外粤语语音合成技术的现状使得研制实用化的粤语语音合成系统将具有特殊意义.该文以完成一个实用化的粤语语音合成系统为目标,对粤语语音合成技术所涉及的一系列关键技术进行了深入研究,主要完成的研究工作有:首先对粤语语言体系进行全面研究,分别从语音、词汇和语法三方面来分析粤方言的语言特色,并系统总结出粤语方言的十大语言特色.其次在合成系统研制过程中,依次对建立基于大语料库粤语语音合成系统所需的关键技术(粤语语料库设计、韵律模型设计和单元挑选模块设计)逐一进行深入研究.在语料库设计中提出语境矢量和语境总量的独特概念,给出粤语语料库语境矢量的组成和分类,提出语境总量的计算方法,并将之应用到语料搜索中,为语料库建立提出更为完整的理论基础.韵律模型设计中给出基频数据预处理、基频曲线聚类的具体解决方案,并对C45决策结果提出了一套正确率测试方法,包括定量误差分析、作图观察等,最后对基频预测的语音进行分析,运用Psola算法进行基频调整以达到最大的听感满意度.单元挑选模块设计中主要针对韵律代价函数中代价权重的确定给出具体地处理过程,分析了目标代价和连接代价的组成以及权值训练步骤,从而保证了实现一个成功的具有较高可懂度和自然度的粤语语音合成系统.此外,该文还抓准了目前移动通信的迅猛势头,提出将粤语语音合成系统应用到移动终端上,针对服务器与客户端之间传输的技术难点提出SOAP解决方案,将整个合成系统的实用化推向更高层面,为粤语语音合成技术的进一步研究提出了更加广阔的发展方向.最后结论部分该文将简要地介绍所研制的KBCT2.0的系统架构和性能指标评测,指出了未来进一步的研究内容和方向.通过该课题的研究,可以对粤语有个整体深入的了解,并对语音合成系统的研制过程有进一步清晰的认识,对其中影响合成效果的关键点给出详细的解决方案,同时,对粤语语音合成系统的应用也提出了更加明朗的发展方向.
其他文献
移动机器人视觉是指在移动机器人上加配视觉传感器,使移动机器人具备对未知环境有识别、检测和自主决策的能力。它在装配加工、智能家居、核事故处理、现代战争侦查等领域表
该文是作者于攻读硕士学位期间在人体运动分析方面所做研究工作的总结.人体运动分析是指从图像序列或视频中提取与人体结构相关的特征信息,并据此完成包括人体姿态识别、运动
作为一种市场机制,拍卖在日常的经济活动中占有重要地位,如电子商务、政府采购和艺术品转让等。“信息”是拍卖理论的基本和核心概念之一,而信息的不对称性是拍卖的主要特征,其对
本论文主要完成基于原型波形内插(PWI-Prototype Waveform Interpolation)算法的语音编码和基于这一算法在汉语语音合成中声调调整方面的研究。原型波形内插(PWI)算法是美国A
目前,现场总线已经成为过程控制领域的热点,代表着过程仪表发展的方向.随着现场总线国际标准的完成,现场总线产品以其完善的功能和突出的特点必将为市场所接受,现场总线压力
摘 要 多智能体系统和分布式人工智能的研究己经成为计算机科学和人工智能研究的热点。多智能体系统是多个智能体的集合。它主要研究了多个智能体在复杂的动态环境下如何
模糊控制具有不依赖于对象的精确模型、鲁棒性好等特点,已经成为解决工业生产过程非线性、大滞后、多变量、不确定性等难控问题的一种重要方法。SCADA系统,即数据采集与监视控
电气设备是电力系统中非常重要的设备,其运行可靠性直接关系到电力系统的安全与稳定."状态检修"是随着管理水平提高和科学技术进步而发展起来的先进维修方式,而故障诊断技术
自动闭塞系统是确保列车在区间安全运行和提高铁路通过能力的一种安全性苛求系统.目前,中国铁路和城市轨道交通中主要应用移频自动闭塞系统.因此,对区间移频自动闭塞信号设备
工业生态学是一门新兴的学科,在该理论指导下形成的生态工业建设已开始成为全球工业可持续发展模式的主体,有关的理论和工业实践呈迅速发展的势头.该文从三个部分对生态工业