基于基音同步的时频域插值的语音合成方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:songshaona
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成的目标是合成的语音可懂、清晰、自然并富有表现力.目前汉语语音合成已经很好地解决了清晰度和可懂度的问题,但是合成语音的自然度一直不理想,表现力较差.无论是自然度还是表现力都要求能对合成语音进行较大范围的韵律调整.针对这样的要求和汉语语音韵律特征复杂的特点,该文引入了基音同步的时频域插值的语音合成方法来改善汉语语音合成的自然度.该文所研究的这种时频域插值方法,能够对韵律参数进行较大范围的调整,并且能够保证调整基频时不影响时长.它兼顾了语音的时域和频域两方面特性,优于一般单纯的时域或频域的语音合成方法.该文还尝试使用非线性的插值方法来提高合成效果,经分析讨论差商型插值效果最好,并且修正了原有合成公式中的错误,从而提高了合成语音的质量.经实验比较证明,基音同步的时频域插值方法确实比传统的波形拼接方法-时域基音同步叠加方法具有更大的韵律调整范围,而且具有更好的调整效果.改进后的时频域插值方法具有令人满意的合成音质,将在情感语音合成中具有较好的应用前景.
其他文献
随着计算机技术的发展和Internet的广泛应用,人类生活越来越密切地依赖于网络,与此同时,各种网络安全问题层出不穷.如何防范来自网络的威胁,成为人们关注的焦点.在各种网络安
该文对AVE组建过程进行了研究,分析了AVE组建过程主要决策问题.针对伙伴选择问题,提出了三段式序贯决策过程和三段式序贯决策模型.对多种伙伴选择优化方法进行了研究和分析.
随着网络技术的飞速发展,应用由局域网扩展到广域网,形成了大规模的分布式应用系统,因此不可预计的故障、甚至是不可抗拒的故障现象也越来越多.同时,公司、企业以及政府逐渐
Web应用服务器为多层分布式企业级应用的开发、部署、集成、运行和维护提供了通用的基础设施。随着在网络计算环境下用户规模和数据量的增长,单个Web应用服务器往往不能满足性
ATLAS (Abbreviated Test Language for All Systems)是一个面向测试的通用语言,这个语言用于描述通常与任何具体测试系统无关的测试过程,并确保可以在自动测试系统ATE(automat
随着软件复杂度越来越高和客户对服务质量、软件可用性的要求逐渐提高,为了减轻软件维护的代价,软件的在线演化逐渐成为软件领域一个重要的研究方向.现在基于构件的软件开发
该文第一章介绍了智能交通管理系统和车牌自动识别系统的发展和现状,以及车牌识别的难点所在.第二章讲述了车牌照识别系统的工作原理与系统设计.第三章研究了车牌从包含有汽
RP技术是20世纪80年代初发展起来的一项高新技术,是机械工程、CAD技术、数控技术、激光技术及材料技术等多学科的有机综合和交叉应用。RP技术借助计算机辅助技术的分层方法,有
我国的电力通信事业正处于迅猛的发展期,电力通信网作为电力通信事业的专用网,已经成为支撑电力系统必不可少的重要网络。电力通信网作为承载电力系统间交互信息的基础设施,
近年来,中国主要的软件研发单位都开始意识到软件测试的重要性,同时随着J2EE应用的日渐广泛,迫切需要一套有效的软件测试支持工具,能对Servlet和EJB测试提供直接支持.该课题