基于说话人自适应训练的汉藏双语语音合成

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:lucky121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。 According to the pronunciation similarity of Tibetan and Chinese, this paper proposes a new method of Chinese-Tibetan bilingual speech synthesis based on hidden Markov model (HMM). Taking the vowels as the synthesis primitives, a corpus of multiple Mandarin speakers and one Tibetan speaker is used, and a speaker-adaptive training is used to obtain an average sound model of a bilingual mixed language of Chinese and Tibetan. Through the speaker’s adaptive transformation, the speaker-related model of Putonghua or Tibetan language is obtained from the average sound model of the mixed language so as to synthesize Mandarin or Tibetan speech. Experimental results show that Tibetan speech synthesized by this method is obviously better than Tibetan speech synthesized by using only the speaker-dependent model under the condition of few Tibetan training sentences.
其他文献
新课程改革的深入,学案导学成为一种深受学生和教师喜欢的教学模式. 借助学案导学开展课堂教学,可以优化课堂教学设计,丰富课堂教学内容,提高课堂教学质量.英语作为高中阶段
期刊
鲁人社发[2012]50号各市人力资源社会保障局,各处室、直属单位,省公务员局:自全省人社系统行政程序年、基层基础建设年和机关作风建设年活动(以下简称“三项活动”)启动以来,
本刊临床研究、基础研究和应用解剖类文稿的中、英文摘要,实验论著和临床论著类的中文摘要,其书写必须采用结构式格式,内容包括目的(Objective)、方法(Methods)、结果(Result
期刊
本文试图通过案例分析,研究当前探究学习中普遍存在的问题,找寻导致探究无效的原因,从而提出探究学习的几条有效策略.
随着我国新课程标准不断在高校教育体系中深入,英语是人才培养的重要学科内容,教师更需要创新教学理念.结合互动教学模式优势,讨论其在课堂中起到的培养质疑思维意识、创新课
当前,新课程改革不断深化跟进,对全面提升学生的综合素养提出了更高的要求.语文的重要功用为人文性与工具性,而表达是语文功能的重要表现方式,不论是口头表达还是书面表达,其
初中物理具备一定难度,物理知识点具有一抽象性.为提升初中物理教学质量,激发学生的物理学习兴趣,教师需要创设一定的物理教学情境.
我国新课程改革正在不断推进,初中物理新课改的一个重要体现方式就是提高学生的科学思维,切实提高学生物理素养.物理新课改对基础知识教育的一个全新认识和提高,要求除了教授
听、说、读、写是语文教学中的四个重要组成部分,它们之间是密不可分的.通过阅读教学可以提高学生的写作能力,很好地实现两者的结合,但在当前小学语文阅读与写作中依然存在着
新年伊始,省教育厅、省委高校工委印发了,现将省教育厅今年关于基础教育工作的要点摘要如下.rn