一种基于Tacotron 2的端到端中文语音合成方案

来源 :华东师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:ydy448681577
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
颠覆性设计的端到端语音合成系统Tacotron 2,目前仅能处理英文.致力于对Tacotron 2进行多方位改进,设计了一种中文语音合成方案,主要包括:针对汉字不表音、变调和多音字等问题,添加预处理模块,将中文转化为注音字符;针对现有中文训练语料不足的情况,使用预训练解码器,在较少语料上获得了较好音质;针对中文语音合成急促停顿问题,采用对交叉熵损失进行加权,并用多层感知机代替变线性变换对停止符进行预测的策略,获得了有效改善;另外通过添加多头注意力机制进一步提高了中文语音合成音质.梅尔频谱、梅尔倒谱距离等的
其他文献
对银行资本这一问题 ,由于有关各方的利益或代表利益不同 ,对银行所持资本的目标也不同。从银行机构自身角度出发 ,存在一个符合市场要求的理想的资本结构目标 ,我们把它称为
2016年8月,宁夏回族自治区吴忠市百利丰农业服务专业合作社联合社注册成立,由1家企业、5家合作社共同组成,注册资金1000万元,服务范围辐射周边4个乡镇、12个村。2016年,联合社经营
10月新品发布会前夕,负责安卓与Chrome平台的谷歌高管Hiroshi Lockheimer其一句推文暗示了此次发布会重要程度将不亚于当年安卓系统的推出。基于之前新内核系统Fuchsia消息外
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:分析我国2004~2011年孕产妇死亡趋势及主要死因,为降低我国孕产妇死亡率提供科学依据。方法:利用平均增长速度对2004~2011年我国孕产妇死亡进行分析,掌握孕产妇死亡原因
小提琴是由欧洲传入中国,经历了由被动接受到国人对小提琴专业的主动拓展,这与音乐学院在社会中的建立有着很重要的关系。音乐学院建立后小提琴专业开始系统化、专业化的教学
开源软件和商业软件结合使用的问题发生在软件编程世界与法律世界(知识产权领域)交界的模棱两可的地方。知识产权法要求划分清楚开源软件和专有软件的界限,以便提供不同的法律保
建筑信息模型(Building Information Modeling,BIM)是以工程项目的各项信息数据为建模基础,进行建筑模型的建立,通过对数据信息的仿真来模拟建筑物所有信息。笔者通过利用建
随着我国经济的发展,科学技术水平不断提高,电子设备在生产和生活中应用越来越广泛,也对指示器的电路提出了更高要求,基于液晶航向指示器接口电路的优化设计有助于提高设备的可靠
近年来,基层央行信息化建设快速发展,业务运行模式不断变化,网络结构不断调整改造。在此背景下,基层央行信息安全风险防控重点和方式随之变化,加之受外围信息安全环境影响,基