论文部分内容阅读
多语种的语音合成研究是近年来国内外语音合成研究的一个热点.实现多语种的语音合成,包括方言、少数民族语言的合成,也是国内汉语语音合成研究的一个重要研究方向.粤语作为一种强势的方言,其特殊地位及潜在的市场价值以及目前国内外粤语语音合成技术的现状使得研制实用化的粤语语音合成系统将具有特殊意义.该文以完成一个实用化的粤语语音合成系统为目标,对粤语语音合成技术所涉及的一系列关键技术进行了深入研究,主要完成的研究工作有:首先对粤语语言体系进行全面研究,分别从语音、词汇和语法三方面来分析粤方言的语言特色,并系统总结出粤语方言的十大语言特色.其次在合成系统研制过程中,依次对建立基于大语料库粤语语音合成系统所需的关键技术(粤语语料库设计、韵律模型设计和单元挑选模块设计)逐一进行深入研究.在语料库设计中提出语境矢量和语境总量的独特概念,给出粤语语料库语境矢量的组成和分类,提出语境总量的计算方法,并将之应用到语料搜索中,为语料库建立提出更为完整的理论基础.韵律模型设计中给出基频数据预处理、基频曲线聚类的具体解决方案,并对C45决策结果提出了一套正确率测试方法,包括定量误差分析、作图观察等,最后对基频预测的语音进行分析,运用Psola算法进行基频调整以达到最大的听感满意度.单元挑选模块设计中主要针对韵律代价函数中代价权重的确定给出具体地处理过程,分析了目标代价和连接代价的组成以及权值训练步骤,从而保证了实现一个成功的具有较高可懂度和自然度的粤语语音合成系统.此外,该文还抓准了目前移动通信的迅猛势头,提出将粤语语音合成系统应用到移动终端上,针对服务器与客户端之间传输的技术难点提出SOAP解决方案,将整个合成系统的实用化推向更高层面,为粤语语音合成技术的进一步研究提出了更加广阔的发展方向.最后结论部分该文将简要地介绍所研制的KBCT2.0的系统架构和性能指标评测,指出了未来进一步的研究内容和方向.通过该课题的研究,可以对粤语有个整体深入的了解,并对语音合成系统的研制过程有进一步清晰的认识,对其中影响合成效果的关键点给出详细的解决方案,同时,对粤语语音合成系统的应用也提出了更加明朗的发展方向.