基于隐马尔可夫模型的说话人转换研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiaodehuwei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着语音合成技术的不断发展,计算机合成语音的音质和自然度都有了明显的提高。用户也对语音合成也提出了更高的要求——多样化的语音合成,包括多个发音人、多种发音风格、多语种的合成等。目前在语音合成领域,为了满足这种多样化的要求通常采用自适应的方法进行说话人的转换,根据少量的目标说话人的数据,采用一定的方法对源说话人的语音参数进行调整,进而得到与目标发音人相似的语音。为此,本文对基于隐马尔可夫模型HMM(Hidden Markov Model)的说话人转换技术进行了详细的介绍,为改善不同情况下说话人转换的效果进行了相应的研究。论文第一章主要概述了本文的研究背景和说话人转换技术相关概念与方法。首先介绍了近几十年来语音技术的发展情况,然后简要分析了现有的几种常见的说话人转换方法,包括基本的思想、实现方法和优缺点等。论文第二章主要介绍了目前最为常用的基于HMM模型的说话人转换基本框架。包括HMM合成系统的流程,关键技术点,以及现在最常用的最大似然线性回归MLLR(Maximum Likelihood Linear Regression)自适应方法,为本文在说话人转换方面的工作做基础和铺垫。论文第三章主要讨论针对极少量目标数据时的本征语音(EigenVoice)模型自适应方法。为了改善在极少量数据时的说话人自适应效果,主要通过建立多个发音人模型,由最大似然准则进行模型加权的方法来实现说话人的转换。实验验证了仅有几句话时该方法相比MLLR自适应可以取得更好的效果。论文第四章主要结合最大后验概率MAP(Maximum A Posteriori)准则来改善现有的说话人转换效果。首先分析了MAP,结构化MAP(SMAP)等基本方法,然后通过MLLR、MAP、SMAP等的系统实验验证了结合MAP准则后自适应效果的改善,最后通过实验总结了现有自适应方法的效率与性能表现。论文第五章是针对跨语种的说话人自适应研究。主要是中英文的跨语种自适应,介绍了基于HMM的跨语种自适应方法,并通过实验研究了中英文跨语种自适应的效果。
其他文献
词汇教学是汉语国际教育教学的一个重要组成部分,正确、合理、有区别地使用近义词更是汉语二语学习者需要突破的难点。本文结合语义、语法、语用的考查,归纳出近义词辨析的要
针对当前植物景观三维图像表面点自相似性系数较低,边缘锐化效果较差的问题,提出基于色调映射和颜色特征分解的植物景观三维图像边缘锐化方法.采用稀疏线性组合方法进行植物景观三维图像的边缘轮廓特征分解,提取植物景观三维图像的边缘分块特征量;根据植物景观的表面点、细节区域进行植物景观图像超分辨率重构和模板匹配,重建植物景观图像的整体直方图分布模型,采用色调映射和颜色特征分解方法,获得植物景观三维图像边缘锐化
目的:评估手术切除联合术中注射得宝松加术后早期放射治疗瘢痕疙瘩的疗效。方法:125例患者随机分为对照组和治疗组,对159处瘢痕疙瘩全部行手术切除,治疗组术中在切缘处皮肤真
会议
语音合成,也就是我们熟知的文语转换(TTS),是一种将给定的输入文字转换成人造的智能语音的技术。近年来,随着计算机技术的快速发展,语音合成技术被广泛应用于各种应用中,例如
农村作为我国8亿农民生产和生活的场所,其公共卫生状况的优劣事关整个社会公共卫生整体状况的优劣。公共卫生作为一种公共产品,有着自己的特性,由于我国特殊的国情所致,农村公共
文化和语言有密切的联系,二者相互依存.外语教学不仅是语言教学,还包括文化教学.跨文化交际中出现文化制约因素主要来自对目的语文化和母语文化之间差异的不了解.在经济全球
陕西蓝田水陆庵诸圣水陆殿南稍间横墙西壁有一尊佛像坐于孔雀背负的莲台之上,背有孔雀尾佛光。这种骑孔雀的佛像非常罕见,关于这个佛像的图像志目前学者们争议比较大,有人认
法律全球化在学术界是一个颇有争议的问题.然而,作为经济全球化在法律方面的必然反映,法律全球化的发展已是势不可挡.文章分析了法律全球化的内涵、实现条件及对我国社会发展