小数据下的音素级别说话人嵌入的语音合成自适应方法

来源 :计算机学报 | 被引量 : 1次 | 上传用户:wuyu9603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度的问题.使用少量的用户录制数据微调预训练的语音合成模型的自适应方法尽管能提升合成音频的相似度,但是也常伴随着自然度的下降.为了解决这个问题,本文提出了一种基于音素级别的说话人嵌入的语音合成自适应方法.在训练阶段,从真实的特征片段中提取音素级别的说话人嵌入,控制语音合成模型的训练.在自适应阶段,通过对说话人嵌入预测网络进行快速自适应,在推理阶段代替真实音频得到音素级别说话人嵌入帮助模型合成音频.实验使用了少量真实的用户录制数据,对现在主流的不同粒度的说话人嵌入方法进行了性能比较.实验表明,相比较各种不同的说话人嵌入方法,本文提出的方法在不更新语音合成模型的情况下保持自然度不明显下降,并取得了最好相似度;在更新语音合成模型的情况下,该方法同时达到了最好的自然度和相似度.分析发现音素级别的说话人嵌入方法在几乎不增加自适应训练时间的情况下,提供了更好的模型自适应初始点,有效地提高了自适应模型合成声音的质量.
其他文献
<正>在去年的全国劳动模范和先进工作者表彰大会上,习近平总书记精辟概括了劳模精神、劳动精神、工匠精神的深刻内涵,指出劳模精神、劳动精神、工匠精神是鼓舞全党全国各族人民风雨无阻、勇敢前进的强大精神动力,强调要大力弘扬劳模精神、劳动精神、工匠精神。近日,习近平总书记在对职业教育工作作出重要指示时再次强调,要加快构建现代职业教育体系,培养更多高素质技术技能人才、能工巧匠、大国工匠。
期刊
<正>《中国中医药报》2018年4月5日讯:日前,吉林大学金英花课题组成功发现了人参皂苷的人类靶点,为认证人参的抗肿瘤功效提供重要线索,并将为抗肿瘤药物的研发提供新思路。部分成果在世界权威科技期刊《自然》旗下开放子刊《科学报告》上发表,这是有关人参皂苷人类靶点的首次报道。金英花是吉林大学生命科学学院教授、博士生导师。2014年,金英花教授课题组开始对人参皂苷开展现
期刊
<正>2022年10月13日,一汽红旗官方宣布,红旗研发总院成功试制红旗首款可移动智能充电机器人样件。可移动式智能充电机器人集成了机械臂、自动化技术,以及全场景复杂环境下高可靠视觉系统,结合行业领先的机器人控制技术,为新能源电动汽车无人充电场景提供了一套安全可靠的解决方案。
期刊
目的 分析由误吸继发细菌感染引起的吸入性肺炎的发病特征、病原菌特点及治疗方案,为临床诊断及治疗吸入性肺炎提供依据。方法 选取2019年11月至2020年7月就诊于北京清华长庚医院急诊科并确诊为吸入性肺炎的53例患者的临床资料。根据病原学结果,将患者分为革兰氏阴性(G-)菌组44例和革兰氏阳性(G+)菌组9例。收集患者人口学资料、实验室指标、病原学检测结果、抗生素使用情况及有效性等数据。采用SPSS
近些年来伴随着网络的快速发展,依托于网络所产生的跨境电商也更加具有全球性和非边界性的特征,通过电子商务平台进行交易和结算,用户在订购之后由企业通过跨境物流,将商品送在用户手中,这种国际商业活动目前在全世界范围内都十分普遍。跨境电商所采用的贸易模式,主要包括:B2B和B2C等,与传统外贸模式有很大的不同,在经济全球化背景下,探析跨境电商对传统外贸企业的影响有很大的意义。
PLC即可编程控制器,由多个标准模块组合构成,可结合实际运作过程中的控制需要,适当增减控制模块的实际数量。正因为如此,PLC控制系统与微机控制系统相比之下具有更大的柔性。数控机床的作业环境相对恶劣,存在复杂的电磁环境,长期持续受到强烈的噪声震动影响,因此要求数控机床控制系统具备较强的抗干扰性。PLC强大的抗干扰性恰好满足了这一需求,且具有更加理想、出色的稳定性,适用于数控机床控制系统。使用PLC数
为提高公路养护机械化水平,提高公路养护效率及质量,对公路养护机械设备前期管理的重要作用和目前存在的问题进行分析,从规划选型、采购管理、验收调试等方面提出机械设备前期管理的有效方法,以期为相关单位提供参考,促进公路养护事业高质量发展。
随着制造业数字智能化浪潮的兴起,越来越多的机器人被应用于工业拆垛场景中。其中基于示教器控制的传统工业机器人由于操作简单且容易维护,当前国内许多电梯制造企业在扶梯梯级自动化拆垛场景中采用此类机器人进行相关作业。然而此类机器人需要梯级垛堆严格放置在固定的示教点,一旦由于某些因素导致梯级垛堆偏离原始示教点,则会使机器人定位失效从而致使抓取失败,极大影响自动化生产效率。目前基于机器视觉定位方法实现拆垛作业
学位