统计参数语音合成中语音参数化方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：tomjerry2005

【摘要】

：

统计参数语音合成方法近年来吸引了越来越多研究者的关注，特别是基于隐马尔可夫模型(Hidden Markov Model，HMM)的语音合成方法。该合成方法具有输出语音平滑连贯、语音参数灵活

【作者】

：

温正棋

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2013年期

【关键词】

：

语音合成隐马尔可夫模型激励模型语音分析合成模型参数生成算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

统计参数语音合成方法近年来吸引了越来越多研究者的关注，特别是基于隐马尔可夫模型(Hidden Markov Model，HMM)的语音合成方法。该合成方法具有输出语音平滑连贯、语音参数灵活控制、系统搭建快速和资源文件空间占用小等优点。但是该合成方法也有其局限性，如过于简单的语音分析合成模型造成合成语音的音质和清晰度都不够高和过于平滑的语音参数生成轨迹造成合成语音的自然度和清晰度都不够理想。本文以基于隐马尔可夫模型的语音合成方法为对象，对该方法中的语音参数化方法展开深入研究，在准备阶段提出了建模精度更加精确的语音分析合成模型，在合成阶段对语音参数生成算法进行了优化。本文的具体研究工作和成果如下:　　提出了基于谐波噪声的混合激励模型。语音信号逆滤波后得到的残差信号，它的频谱可以通过一个最大谐波频率划分为低频段的谐波成分和高频段的噪声成分。因此在该模型中提出了基于K均值聚类的最大谐波频率估计算法，将残差信号的频谱按照每个子带划分谐波和噪声两类，通过一个维特比(Viterbi)算法搜索最优的最大谐波频率轨迹。当将该模型加入到基于隐马尔可夫模型的语音合成系统中时，最大谐波频谱作为一个独立参数流加入到模型训练。在合成时，激励信号的低频段通过一组谐波相关的正弦信号来构建，高频段采用高斯白噪声来合成。实验结果表明该方法能够有效的减弱合成语音的蜂鸣声，取得了比传统脉冲串激励模型更好的合成效果。　　提出了基于残差信号频谱重构的语音分析合成模型。残差信号的频谱除了在高频段体现出噪声结构外，它还保留了一些频谱信息，这些信息在线性预测频谱中并没有进行考虑。因此，本模型采用了基于多基音周期(Pitch-ScaledAnalysis)的频谱分析方法，该方法能够方便提取残差信号中的谐波结构，并将这个谐波结构保留为激励的周期频谱。激励的非周期成分定义为残差信号频谱上的谐波噪声比，并通过最大谐波频率拟合成一条S函数曲线。当将该模型加入到基于隐马尔可夫模型的语音合成系统中时，激励周期频谱分别通过主成分分析(Principal Component Analysis，PCA)、码本索引和深层神经网络三种压缩方法进行降维和重构，并且和非周期成分作为两个独立参数流加入到模型训练。实验结果表明基于残差信号频谱重构的语音分析合成模型提高了基于线性预测的语音分析合成器和基于隐马尔可夫模型的语音合成系统合成语音的音质和清晰度。　　提出了基于统计量调整的参数生成算法。基于隐马尔可夫模型的语音合成系统生成的参数轨迹存在过平滑问题，这是由于基于决策树的聚类使得语音参数严重“平均化”，生成参数的共振峰结构变得不清晰，从而造成合成语音的清晰度和自然度上不够理想，存在发闷的效果。一种改进方法是结合整体方差(Global Variance，GV)的参数生成算法，但是该方法只考虑了参数的一阶统计量和二阶统计量。因此在基于统计量调整的参数生成算法的参数生成过程中考虑了语音参数的一到四阶统计量。实验结果表明在合成语音的清晰度和自然度上基于统计量调整的参数生成算法要明显好于结合动态特征的参数生成算法，因为增加考虑了三阶和四阶统计量，其合成结果也要优于结合GV的参数生成算法。

其他文献

水下视频的运动目标检测算法研究

随着游泳运动的流行，游泳过程中的溺水事故频繁发生。而工作人员可能因周围环境嘈杂，水中情况混乱和自身精力有限等原因导致不能及时发现游泳者的异常情况而致使惨剧发生，为此需

学位

运动目标检测水下视频监控目标分割码本模型Canny边缘检测

魔方机器人展示系统研究与开发

智能机器人技术随着机器人学、计算机科学、计算机视觉等学科的发展,应用范围和实用价值得到了更广泛的关注和提高,成为当今世界高科技领域备受关注的热点课题。近年来对于科

学位

魔方计算机视觉TM算法蓝牙机器人控制

直接转矩控制系统低速性能的研究

该文首先讨论了感应电机直接转矩控制系统低速运行时存在的题,以及相应的各种解决方法,并在此基础上分析了定子磁链观测模型对系统低速性能的影响,提出了一种适合于整个调速

学位

直接转矩控制模糊控制低速性能

复杂环境下人群流量监控关键技术研究

近年来，大型公共场所的人群活动愈来愈频繁，合理管理大规模人群活动具有深远的研究意义。智能人群监控系统能够实现全天候的人群管理，减少公共场所的安全隐患。本文旨在研究复杂

学位

复杂环境人群流量监控系统行人计数CASIA数据库数据采集

一类具有长时延网络的预测控制方法研究

浅海油气田地处浅海滩涂,环境恶劣,油气井的操作控制需要技术人员现场操作,安全性低,实时性差。针对这些问题,建设油田自动化系统,以实现油田自动化生产。针对建设油田自动化

学位

网络控制系统长时延时延补偿广义预测控制

过程控制系统中异常数据检测方法的研究

随着现代工业的飞速发展,流程工业对过程控制系统的控制精度、响应速度、稳定性等提出了更高的要求,对过程的建模也越来越多,越来越复杂。然而大多数的建模方法往往都依赖于

学位

过程控制系统异常数据检测小波变换电弧炉

不等长间歇过程的统计建模及在线监测

近年来,随着现代社会对多品种、多规格和高质量产品的迫切需求,生产小批量、高附加值产品的间歇过程己成为工业中一种重要的生产方式,被广泛应用于食品、精细化工、生物制药

学位

间歇过程不等长数据多时段动态时间弯曲多元统计在线监测

恶劣条件下GPS的RAIM算法研究

随着GPS在民用航空领域的广泛应用，航空导航高精度、高安全性和高可靠性的特殊需要对导航系统的完好性监测能力提出了很高要求，加强对GPS完好性监测技术研究，及时有效的检测和识

学位

GPS完好性监测改进RAIMGPS/INS紧组合导航辅助RAIM

基于智能体协调策略的分布式预测控制问题研究

随着计算机网络的迅速发展,控制已不再局限于集中式控制,更多采用的是分布式控制,同时预测控制作为一种先进的过程控制方法已被广泛地应用在各种工业过程中。实际系统中大量

学位

模型预测控制分布式控制终端约束多智能体

工业锅炉微型计算机控制系统设计

该论文通过分析典型的工业锅炉-SZS50-1.5T/250-Y油炉的运行特点,以及水位系统和燃烧系统的特性,设计了利用高质量计算机构成集散控制系统(DCS)进行锅炉微机的自动检测和自

学位

工业锅炉计算机自动控制

统计参数语音合成中语音参数化方法研究

与本文相关的学术论文