基于分离对比学习的个性化语音合成

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:adidas9910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化语音合成,是指根据目标说话人的参考语音,合成具有目标说话人风格的语音。参考语音同时依赖于目标说话人风格和语音中的文本内容。现有方法将参考语音作为一个整体进行对比分析,但是在说话人风格和语言内容的两个方面,没有进行分离对比分析,导致了合成语音受到语言内容的干扰,而偏离目标说话人风格的问题。本文设计了一种风格与内容分离的对比损失,用于个性化语音合成模型。该模型包括风格-内容分离对比模块,说话人模块,语音解码器模块。风格-内容分离对比模块将查询参考语音中的风格和内容视为正例,并使用风格-内容分离的负例。该分离负例能够促使查询的风格和其他参考语音中的内容分离,同时,能够促使查询的内容与其他参考语音中的风格分离。风格内容分离对比模块用于学习兼顾风格-内容的语音特征。说话人模块学习说话人身份特征,并用于引导说话人风格学习。语音解码器模块,融合风格-内容的语音特征和说话人身份特征,用于提高对持续时间、音高、能量的说话人风格描述能力。在VCTK和LibriTTS两个数据集上的实验表明,本文方法提高了合成语音的说话人相似度,合成语音的质量优于现有方法。
其他文献
报纸
本文针对当前中深层地热能源站建设过程当中存在的机电施工效率低的问题,从应用工厂预制技术减少现场施工量、应用非焊接连接技术简化现场装配难度、应用二维码物流管理技术提升施工协同效率、优化施工顺序消除土建与机电施工误差4个方面对应用需求和实施方法进行了分析和研究,为实现中深层地热能源站快速建站提供了解决思路。
期刊
区域经济学研究的核心问题是资源配置活动对地理空间的依赖和两者的相互影响及相应的区域经济空间形成和变化。本文在马克思主义政治经济学的指导下,坚持理论、历史与实践逻辑统一的研究思路,提出了区域经济学研究中自然、技术与制度三者互动的研究主线及相应的研究框架,结合中国区域经济发展的丰富实践,借鉴现代区域经济学的理论,聚焦社会主义市场经济中有效市场与有为政府的互动,探讨区域经济发展中具有中国特色的自然、技术
期刊
<正>时代在进步,中西方文化的融合,对新时代人们的思想观念造成极大的影响,离婚率增加,促使单亲家庭数量增多,不少单亲家庭学生的家庭教育是不足的,造成学生缺乏自信,对学习难以产生兴趣,养成不良的生活习惯,而且父母长时间地分离,也会使其身心受到极大伤害。由于缺乏关爱,学生心理、精神压力大,如果不实施健康教育,学生易出现心理问题。所以,教师应该高度重视单亲家庭学生的心理健康教育工作。学生进入青少年时代,
期刊
期刊
本次利用卫星遥感和地理信息技术手段,结合地质、环境、遥感等信息,在工作区的地质、地貌、环境地质条件、已知地质灾害点特征基础上,建立了遥感解译标志,对本区地质环境背景条件(孕灾背景)和地质灾害进行了解译。本文重点介绍和探讨地质灾害解译工作流程和解译效果。本次对泾县范围内解译了120个点,经野外现场验证,其中42个为滑坡灾害点,12个为道路切坡点,4个为建房切坡点。实际地质灾害点42个,正确率35%。
期刊
期刊
期刊
中国博大精深的优秀文化源远流长,岭南文化作为中华民族文化的一种,在中华民族文化的发展史上居于重要地位,在近代中国成为一种先进文化,具有鲜明的时代特征。自改革开放以来,岭南文化一直处于独树一帜的地位,能够在一定的程度上推动社会的进步,促进经济的发展。岭南地区文化发展活跃,保留了很多中华民族古老且优质的文化。岭南文化包含粤语、粤剧、民俗艺术、建筑文化及岭南特色饮食等等,内涵丰富,极具特色。岭南特色文化
学位
期刊