汉语文语转换系统HJ-TTS关键技术的研究与实现

来源 :中国科学院研究生院(计算技术研究所) | 被引量 : 17次 | 上传用户:mercurian88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文语转换系统(Text-to-Speech)是人-机交互接口的重要组成部分,也是中文信息处理中的一个难题。本文以华建语音翻译系统为研究背景,对文语转换系统的语言学处理和韵律表述两方面进行了深入研究和探讨。 文语转换的目的是将计算机内存储的文本自动转换为声音输出,这项技术已经随着语音合成的发展逐步走上实用,它在信息发布系统、语音自动应答系统、语音电子邮件系统、残疾人语音服务等领域具有广阔的应用前景。它的研究对于人机语音通讯、自然语言人机接口和智能计算机系统的研制,都具有十分重要的理论意义和实用价值。 随着计算语言学和语音学的发展,文语转换技术取得了长足发展。它从仅仅对语音信号做浅层分析发展到对语言学和语音学知识的综合运用:从机械式的语音合成发展到利用计算机进行语音输出。尽管如此,目前文语转换技术仍有许多不尽人意的方面,这主要表现在:系统的语言学处理部分还不能对文本做深层的语义分析,不能在文本理解层面上给后期合成提供必要的信息:语音的音段特征难以提取和定量分析;合成语音的评测标准和方法还不完善等。 为了改善文语转换系统的性能,作者对系统的语言学处理部分进行了详细阐述和分析:丰富并改进了句子边界确定、特殊符号处理等规则:根据文语转换系统中分词的特点,实现了基于特征集合的语音分词算法和分词消歧策略;针对多音字发音描述问题,作者改进了词库结构和多音字存储方式,并在此基础上设计了多音字筛选算法。 呼吸群边界划分作为汉语韵律的一种表现方式,它在语音感知和文语转换系统的性能方面起着十分重要的作用,作者在对汉语句法结构、句子长度和和呼吸群划分之间关系的研究基础上,设计并实现了基于句子长度和句法结构的呼吸群边界划分算法;为更好地描述文语转换过程,作者提出了适合汉语语音合成的SSML韵律标注语言,该标注语言不仅从声学层上对语音的韵律进行描述,而且从语言学层上标注句法结构信息,最后本文对基于语言理解的韵律规则用SSML进行了描述并用实验验证了语言学层面的标注对系统自然度的影响。
其他文献
本文主要研究基于偏微分方程(PDE)的图像处理方法,特别是非线性扩散模型在图像去噪中的模型和图像分割中的应用.在本文的第一部分,我们考虑一类与图像去噪相关的扩散-对流方程.首
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
随着电子银行、电子商务和各种智能卡的出现和普及,如何准确而可靠地进行个人身份的自动鉴别成为近来研究的一个热点问题,具有十分广泛的应用前景。利用人体生理或行为特征的
<正>1病历资料患者,女,64岁,体质量55 kg,因突发上腹痛,持续进行性加重9 h于2017年8月1日入院。既往身体健,无食物、药物过敏史,无有毒物质接触史。体格检查:体温为36.7℃,心
随着光电成像技术的不断发展,现代成像系统能够在战术有效距离内显示出越来越具体的目标细节和场景内容,在大大改进了成像距离和成像清晰度的同时,也使得“场景内容”成为影响光