基于深度学习的文本风格转换研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wangmeiqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本风格转换是一项可控的自然语言生成研究任务,它旨在改变文本的风格属性的同时尽可能保留原文的内容,是人工智能领域的重要问题,反映了计算系统的智能能力。随着人们对自然语言生成系统的需求不断增加,研究控制生成文本的各种属性具有广泛的应用前景,如情感转换、新闻改写、对话情绪生成等。随着智能对话、智能助手等人工智能领域的蓬勃发展,未来对可控的文本生成技术的需求将愈加强烈。因此,研究文本风格转换技术具有重要的现实意义。论文通过对国内外研究现状和研究方法分析发现,多数文本风格转换方法将文本映射为风格无关的隐含向量,然后解码成具有目标风格的新文本。这些方法难以引入外部数据或者加入人为监督信号,并且由于模型是端到端训练,转换的过程不可解释,人们无法了解句子改变的位置和原因。因此在本文中,我们针对上述问题提出了“基于掩码的风格生成方法”。首先,本文利用自注意力模型和风格词典的方法来分析每个句子中风格属性较强的部分,并提出一种混合策略对句子进行mask操作,得到的mask句子即为原始句子去风格化的表示。mask句子完整地保留了原句的格式,并且可以清晰地看到被mask的位置,使转换的过程更加易于理解和控制。其次,本文将风格转换问题视为文本生成任务,使用Transformer对mask句子进行再生成,通过加入目标风格信息的控制,使模型能够根据mask句子中的信息,生成具有目标风格的新语句。本文对所提出的风格转换模型进行了测试,在两个正负向的评论数据集上进行评论积极/消极的风格转换实验并评估。实验结果表明本文模型的综合效果略优于当前几个经典的方法,并且中间结果---mask句子清晰地展示了转换的过程,反映了该方法对于句子中风格信息较强的捕捉能力以及对句子格式较好的保留能力。在此方法的基础上,本文对文本风格转换系统进行了设计与实现。文本风格转换系统主要包括Masker模型、模型训练模块、数据采集模块、数据处理模块以及风格转换模块。对模块的主要功能以及流程做了详细的介绍。最后通过对文本风格转换系统的在线/离线测试,证明了系统功能有效性以及稳定性。结果显示,本系统可以对文本进行有效的风格转换,可以帮助用户修改文本的风格。
其他文献
目的:探析医护一体化在脊柱骨折患者术后快速康复中的应用价值。方法:在本院2017年1月-2019年1月收治的脊柱骨折患者中选出180例为对象,根据护理方法分组,对照组给予常规护理
楔子五月的江城,河流两岸的风已是暖洋洋的。一路不停步地走到城北的山坡上,凌熠的额上微微渗出了的汗珠。他感慨说,到底年岁不饶人,蔚晨啊,你看我都跟不上你的步伐了。一片
期刊
上海市于2019年7月率先开始实施垃圾分类工作,湿垃圾的分类与处理是垃圾分类的痛点问题。在小区垃圾分类站,采用食物垃圾粉碎处理器对湿垃圾进行固液分相处理是实现湿垃圾源
NK细胞作为机体固有免疫的重要组成部分,在肿瘤免疫监视机制中起重要作用。NKG2D是NK细胞重要的激活受体,通过识别位于肿瘤细胞表面的NKG2D配体,介导细胞毒效应清除肿瘤细胞
以灼烧净水污泥为研究对象,探讨在其不同投加方式(混匀和覆盖)下,各底泥对外源磷的吸附效果以及间隙水和底泥中各形态磷的数量分布.结果表明,相比未灼烧净水污泥,灼烧净水污泥
读一本书如同上一堂课,蒋先生以时间为轴线,在书中介绍了中国各个历史时期的美术特点,以及造成这些美术风格变化的原因。这本书为每个人都打开了一扇门--一扇美的门!一扇观看
花生产业在世界各地都有分布,从20世纪90年代开始,全球花生种植面积开始逐步的增加,全球的花生总产量也在逐年的增长。肥料作为粮食生产的主要投入要素之一,对粮食增收发挥了重要作用。中国农户数量大而且分散,农户施肥行为存在肥料利用率偏低、施用量过多等诸多问题。阜蒙县地处辽宁省西部,农业生产条件比较差,农民的收入水平偏低,耕种地块比较分散。农户不合理的施肥行为不仅增加了农户农业生产成本,同时也对土壤、资
三维目标:1、知识与能力:掌握文言文翻译的基本方法;2、过程与方法:以翻译为切入口,落实文言文复习;3、情感态度和价值观:培养学生答卷严谨的精神,字斟句酌的习惯,培养学生文
2017年,全球传奇买手店Colette关店,Triple-Major上海店宣布结业,两家买手店头牌的举动引起行业哗然,然而国内其他买手店却仍保持着"激流勇进"的态势,全国买手店激增至上千家
近日,中共中央办公厅、国务院办公厅印发了《关于进一步深化税收征管改革的意见》,并发出通知,要求各地区各部门结合实际认真贯彻落实。《关于进一步深化税收征管改革的意见