TTS系统中合成单元实例选择方法的改进

来源 :清华大学 | 被引量 : 0次 | 上传用户:xuelin_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这篇论文中,主要介绍在合成单元实例选择方法中代价权值的确定方法、上下文信息特征的确定等方面作的一些改进和完善,并提出了一个衡量合成语音质量的标准.经过改进,TTS系统合成输出的语音效果有了较大改善. 确定代价权值的主要思路是:对语音库中单元进行分类,对各类单元分别计算它们之间的距离以及它们各特征之间的距离,然后对这些距离进行线性回归,从而得到该类单元各特征恰当的权值.为了确定上下文信息特征,提出了几种定义各声母之间、韵母之间以及声韵母之间距离的方法,加以比较,选择效果最佳的区别特征分类法,并把按此方法得到的一系列距离作为语音单元上下文特征的距离.此外,还定义了一个倒谱与声强相结合的评估标准,用在线性回归中,同时也用这个标准来衡量合成语音的质量,从而判断所作的改进是否有效.文章第一章主要介绍研究背景和目前的几种高质量.第二章介绍了李建民博士提出的混合TD- PSOLA算法的合成语音单元实例选择法以及具体实现方法.第三、四、五章着重介绍了对代价权值的确定、上下文信息特征的确定等方面的改进和完善.第六章介绍了一些相关工作.
其他文献
该文是介绍在矩形件的优化排料中应用遗传算法来进行求解的过程.该文在介绍了排料问题的研究现状后,详细地分析了遗传算法的原理和特点.我们在许多该领域求解矩形件优化排料
该文提出了集成化企业的建模方法,并重点论述了组织视图的建模方法.针对不同形态的企业组织结构,提供了相应的组织对象的描述方法.该文给出了企业组织模型的结构、模型定义、
计算机网络的广泛应用对网络存储提出了越来越高的要求,而近来一种新型的网络结构——存储局域网(SAN)为此提供了一种解决思路。国外的许多企业都把SAN作为未来网络的发展方向,并
提供端到端的延迟保证是Internet能够支持分布式多媒体等实时应用的先决条件之一.目前,IETF为此而提出的解决方案或者能够满足不同应用的特定延迟要求,但不具有可伸缩性(Ints
该文在参考了国内外网络安全技术研究最新发展动态的基础上,提出了主机网络安全体系结构,并对其中的关键技术:入侵检测、访问控制、加密传输和身份认证进行了比较详细的总结
企业资源计划(ERP)是从制造资源计划发展而来的.针对传统ERP系统的不足,该文提出了基于多Agent的柔性企业资源计划(F-ERP)系统的模型,并对该模型做了深入的研究和探讨.论文的
该文首先论述了课题相关的概念和技术扫展现状.其次对空间决策支持系统的构建方式和知识库的组织结构及两者的关系进行了分析,提出了一个适用于智能化SDSS的空间知识库系统模
本文对具有Windows风格的实时测控软件的设计与实现方法进行了系统研究,并结合新疆吐哈油田井下工具试验站计算机测控系统的研制项目,完成了该系统的软件设计和实现。系统性能
Internet是世界上最大的互联网,它提供了基于不同协议上的多种服务,而WorldWideWeb服务是其中应用最多最广泛的一种.Web的开放性和日益增长的规模,使其成为人们自由交流信息
该文介绍了一种在操作数据存储中如何优化选取实视图数据的方法——基于多查询图表示的状态空间搜索算法,并对实视图数据维护过程中如何消除数据的不一致进行了讨论.该文的重