【摘 要】
:
印度尼西亚语(简称印尼语)源自于苏门答腊岛东北部的马来语,属于马来-波利尼西亚语系。世界上约有三千多万人将印尼语作为他们的母语,且大约有一亿多人将其作为第二门语言。现代马来语和印尼语都使用拉丁字母拼写,两种语言的拼写也比较接近。论文以开发印尼语文语转换应用系统为目的,设计并实现基于隐马尔可夫模型(Hidden Markov Model,HMM)的印尼语文语转换基线系统,并在此基础上探索提高语音合成
论文部分内容阅读
印度尼西亚语(简称印尼语)源自于苏门答腊岛东北部的马来语,属于马来-波利尼西亚语系。世界上约有三千多万人将印尼语作为他们的母语,且大约有一亿多人将其作为第二门语言。现代马来语和印尼语都使用拉丁字母拼写,两种语言的拼写也比较接近。论文以开发印尼语文语转换应用系统为目的,设计并实现基于隐马尔可夫模型(Hidden Markov Model,HMM)的印尼语文语转换基线系统,并在此基础上探索提高语音合成自然度的方法。论文的主要工作包括:(1)音子自动切分。本文根据印尼语的语音特点,分别按声韵母结构和按音素结构确定了两类合成基元。并使用基于HMM的自动切分技术,依据两种不同的合成基元,对印尼语音子展开自动切分工作,为本文后续文转语的进一步深入研究奠定基础。(2)模型训练及语音合成的实现。本文在HTS(HMM-based Speech Synthesis System)的基础上,建立了一个完整的语音合成系统框架。首先设计了三音子上下文属性及问题集,并通过决策树聚类进行声学模型的训练,最终实现印尼语语音的合成。(3)印尼语语音合成系统的改进。本文对印尼语语音合成系统进行了三方面的改进工作。首先,对于印尼语中存在的零声母现象,本文设计了符合印尼语声学表现且匹配训练系统的零声母音子,对引入零声母后的合成系统进行了实现。其次,由于印尼语是用拉丁字母书写的语言,音素是印尼语的基本组成部分,因此,本文考虑选取印尼语音素作为合成基元,设计了基于音素及三音子的语音合成系统,不仅提高了音子切分的正确率,同时改善了语音合成的质量。最后,本文设计了基于音素及五音子的合成系统。重新设计了上下文属性及问题集,并进行声学模型训练,最终合成出了高质量的语音。实验结果表明,选取音素作为合成基元进行音子自动切分时,切分正确率达到了89.36%,较之前按照声韵母结构选取的音子进行切分时提高了 13.04%。对于语音合成结果,改进系统的合成语音在自然度与精确度方面也都得到了很大的提升。
其他文献
近年来,四参数逻辑斯蒂克模型重新引起研究者们的兴趣,但由于精确、稳健且实用的参数估计方法的缺失而一直未得到广泛的应用。本文从潜变量混合模型的视角改写了四参数逻辑斯蒂克模型,提出了期望三重最大化算法(Expectation-3-Maximization Algorithm,EMMM),并在结合贝叶斯方法后得到了贝叶斯期望三重最大化算法(Bayesian Expectation-3-Maximizat
随着我国工业化进程的加快,工业自动化水平不断提高。物流这个劳动力密集的行业要想降低成本,提高自动化水平显得尤为重要。物流AGV(自动引导车)作为室内仓库中重要的运输设
近年来平板显示产业规模持续扩大,智能手机,平板电脑等电子产品的兴起使得平板显示屏生产制造规格越来越大。在液晶面板生产过程中对其进行缺陷检测,则可以在确保产品良率的
计算机视觉在当今工业物联网中发挥着重要的作用,而图像识别是计算机视觉中最重要的部分之一,卷积神经网络算法由于其较高的识别精度成为图像识别的首选。在很多图像识别应用中,由于对实时性有一定要求,所以神经网络的推理需要在本地硬件上执行,如无人机的碰撞检测等。并且由于GPU功耗较高,限制了其在功耗与资源有限的嵌入式平台上使用,因此需要一种高能效、可配置的卷积加速器来满足卷积神经网络算法在嵌入式平台上的应用
过去的几十年中,由单目相机多方位拍摄的二维图像序列恢复三维非刚体结构NRSFM(non-rigid structure from motion)是机器视觉领域的研究热点之一。但处理NRSFM问题困难重重,
羁押场所作为国家的刑罚执行的重要设施,具有监控管理犯人的重要职能,高水平的管理可有效防止犯人逃脱再次危害社会。最近,羁押场所的押量犯人的数量持续上升,人控管理的传统
缅甸语是缅甸的官方语言,属汉藏语系藏缅甸语族缅甸语支,与同语系的汉语和藏语语音合成研究相比,缅甸语语音合成相关研究亟待重视。本文以开发缅甸语语音合成系统为目的,构建发音语料库,研究并实现文本归一化、分词和文本注音。本文的主要工作包括:(1)构建发音语料库。从缅甸语网站上抓取大约600M原始文本语料,去除语料中的非法字符和重复句子,并统一文本语料的字符编码方式。统计文本语料库中的高频词、句子长度、句
脑卒中是目前危害人类健康的无形利刃,是世界范围内发病率和死亡率最高的原因之一。多对比高分辨率MRI可以无创显示管壁结构和斑块成分,为分析颈动脉粥样硬化斑块提供有效手段。通过对多对比MRI进行对比和分析,可以更准确地发现粥样硬化是否存在、确定斑块部位、判断狭窄程度和斑块成分识别。但是,在磁共振实际检查中,由于得到的多对比序列图像扫描方位和参数不一致、几何空间不匹配以及检查持续时间长,容易产生运动位移
PCB板元器件插件的正确与否决定了电路板的质量及生产成本,尤其是带有极性和方向性的元器件的反接将直接损坏电路板,给生产造成损失。而基于自动光学检测(Automatic Optical
目的:随着CT和MRI等影像学检查的广泛应用和体检的普及,无症状性肾癌的诊断率越来越高,局限性肿瘤比例增加,是否在肾癌根治术中同时行同侧肾上腺切除术越来越受到关注。本课题通过回顾性研究方法,对我院收治的肾癌根治术患者进行随访调查,旨在探讨肾癌根治术中肾上腺切除术的临床意义。方法:回顾分析我院2012年1月1日-2018年12月31日收治的386例获得完整随访的肾癌根治术患者临床及病理资料,其中30