【摘 要】
:
本文提出了一种用于情感语音合成的基频转换方法。该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,使用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参
【机 构】
:
中国科学技术大学电子工程与信息科学系;
【基金项目】
:
国家自然科学基金项目(61273032)
论文部分内容阅读
本文提出了一种用于情感语音合成的基频转换方法。该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,使用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换。在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练。在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换。实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力。
其他文献
<正>《申报》是中国近代以来影响力最大、持续时间最长的报纸之一。1872年4月创刊于上海,1949年5月停刊,前后历时77年之久,累计出版报纸期数两万七千余期,有中国近现代史"百
<正>院前急救是指伤病员在发病或受伤时,由医护人员或目击者在第一现场对其进行必要的救治,以维持基本生命体征、减轻痛苦,并对患者在转送医院途中进行观察监护及做出急救处
红树林在维持大气中的碳平衡中发挥着重要的作用,对红树林的提取方法,生物量估算、碳储量估算方法进行研究,有利于更好地评估红树林的固碳功能。目前对于红树林提取研究很少
【目的】分析不同浓度NaCl处理对密胡杨叶片形态和光合特性的影响,为研究密胡杨盐环境响应机制提供依据。【方法】以盆栽密胡杨为材料,测定分析密胡杨叶片在不同浓度NaCl(0、
对盆地进行了古地磁采样和精确测定及地质分析,确定了昆明盆地是一个断陷盆地,断陷发生于晚上新世并一直延续到现在。对盆地晚新生代沉积地层进行了划分,对沉积环境演变进行
目的:探讨人工髋关节翻修原因。方法:回顾总结19例人工髋关节翻修中发现的问题,分析翻修原因。结果:19例中术前诊断松动8例;脱位3例;深部感染2例;髋臼磨穿2例;断柄1例;髋周及
盘龙江为流入滇池的最大河流,主河道长约100公里,流域面积为847平方公里,在滇池北东形成广阔的三角洲平原(图1)。根据钻孔揭示,该区北东第四纪沉积以三角洲平原沉积物为主,南
目的观察药艾灸治疗乳腺癌相关淋巴水肿的临床疗效。方法采用随机对照临床研究,将40例符合乳腺癌术后相关性淋巴水肿的患者按照1∶1的比例随机分为清艾组(对照组)和药艾组(观
六方水钠锰矿作为环境中一种具有较强氧化与吸附能力的氧化锰矿物,对环境中的有机染料有着一定的去除作用。采用常压回流法一步合成纳米六方水钠锰矿,运用X射线衍射(XRD)、电