面向非平行数据的文本情感迁移及生成研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:eeee_188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深度学习领域中,相比于图像的生成和风格迁移,文本的风格迁移和语义控制还存在很多挑战。文本风格迁移即针对文本表达的情感倾向、时态或话题等属性进行改写从而生成符合目标特性的文本。这其中涉及的语义控制、风格控制等技术对于可控文本生成至关重要。本文针对情感这一广受关注的属性研究并实现文本改写算法。然而平行语料的标注耗费资源且依赖于此的有监督模型效果受制于标注数据的数量和质量,因此本论文聚焦于非平行语料的文本情感迁移与生成算法。这其中文本情感和语义内容的拆分和重组、不同情感间映射关系的建模都颇具挑战。本文针对现存方法在情感转换准确性及内容生成方面的不足提出以下两种改进的深度学习模型。1)基于注意力机制及生成对抗原理的CAM-DAE模型,其通过注意力机制完成情感和内容的拆分,同时通过对抗学习完成无监督情感改写。实验证明该模型性能相比基线模型有明显提升。2)基于无监督回译原理的BTM模型,该模型对两类文本间的转换关系进行建模,通过回译产生伪平行语料进而迭代优化模型。该模型相比基线模型性能明显提升,尤其在文本语义保留方面取得了突破性进展。此外,本文基于BTM模型设计并开发了一款自动评论生成系统。此系统能够自动生成特定主题及情感的评论集,辅助用户进行评论发表。
其他文献
随着政府发布的《国家中长期教育改革和发展规划纲要》文件中的明确要求:“倡导启发式的、探究式的、讨论式的、参与式的教学,帮助学生学会学习。激发他们的好奇心,培养他们的兴趣爱好,为他们营造独立思考、自由探索的环境”正式的提出与实施;我国基础性教学环境要求将会更加严格,必须做好教师在课堂教学的独特作用来引导学生构建以核心素养为主的学习能力体系。尤其是国家重视教师队伍建设的大背景下,大量新手教师走向工作岗
企业持续有效的成长具有积极的社会功能,既可以扩大社会就业,又能够促进经济增长,企业的成长过程反映了企业被市场接受的过程,民营企业作为重要的企业类型,其成长的研究非常
目前,氧化还原反应通常使用金[1]、钴[2]、铁[3]、铂[4,5]、钯[6]等金属作为催化剂[7],金属催化剂虽然催化效率好,但价格昂贵,资源匮乏,还会对环境产生污染。非金属催化剂作为新型的绿色催化材料,近年来引起了很多关注。相比于传统的金属催化剂,非金属催化剂有高效、环保、低能耗和耐腐蚀的有利条件。在烃类转化、化学合成和能源催化等领域,非金属催化剂表现出优异的催化性能和发展潜力。石墨烯是很有前
“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的合称,位于世界油气资源核心分布区域“俄罗斯-中亚-中东-北非-西非”的北段。中国对“一带一路”沿线国家进行油气投资,不仅可以实现油气供给来源多元化和进口途径多样化,以此缓解国内油气资源所面临的现实风险;同时可以通过多边化的油气合作,优化产业结构,进而保障未来的巨大需求。因此,研究“一带一路”沿线国家油气投资环境影响因素,对中国海外油气投资
随着人类社会的不断发展,陆地资源开始日趋匮乏,而海洋覆盖了地球表面的大部分面积,是人类的一个天然宝库,对海洋资源的开发利用将成为今后世界各国新的发展机遇。现阶段对海底进行远距离成像探测主要是通过声呐设备,对于侧扫声呐设备获取的声呐数据,瀑布图像并没有考虑实际的地理位置关系,而按照GPS位置信息拼接后,可以得到反映海底地貌信息的二维侧扫声呐图像;对于多波束测深设备获取的测深数据,则可以反映海底详细的
现实世界中,经济的发展离不开金融,金融本身是一个复杂的体系,金融结构更是一个金融体系的骨架,尤其是针对金融系统的支撑,金融结构的重要性不言而喻,因而对它研究的脚步从未停止过。林毅夫曾在他提出的经典理论--新结构经济学理论中提到,经济结构是一个不断动态优化的过程,是根据不同时间节点下呈现出的不同的要素禀赋,在比较优势下得出不同的产业结构特征和技术风险特性,所对应的金融服务需求不同,进而又决定了金融结
中国和印度作为目前世界上最大的两个发展中国家,自上世纪九十年代以来,经济得到了迅猛发展的同时,化石能源消费量也不断增长,并带来了大量的二氧化碳排放,已分别成为全球第一和第三大碳排放国。随着《巴黎协定》等气候条约的制定,减缓温室气体排放已成为各国共同承担的全球主要环境责任之一。在这种背景下,科学准确地核算中印两国的碳排放量,并定量分析两国碳排放变化的驱动因素,不仅可以为中印两国节能减排政策的制定和低
不同形貌的碳酸钙微粒具有不同的性质和应用领域,因此对碳酸钙形貌的调控就显得尤为重要。本文在传统的高分子有机控制剂调控碳酸钙形貌的基础之上,选取非常规的无机盐控制剂
目前,推荐系统的应用范围越来越广泛,已经成为电商平台、视频播放平台、娱乐社交等平台的基础设施。序列推荐是推荐系统的一个分支,能够从用户与项的信息中挖掘隐含信息并建立用户交互的依赖关系模型。隐含信息包括各个项之间的联系、用户的偏好以及偏好的变化、商品的流行度变化等。依赖关系是指用户在不同时刻交互的产品之间存在联系,例如交易序列中的商品之间存在顺序依赖关系。序列推荐中存在许多问题,如序列数据的稀疏问题
随着人工智能与生物医学工程的飞速发展,机器学习技术已逐渐成为医疗领域医生诊断、分析病情的重要工具。癫痫是一种常见的神经系统疾病,临床患者数量众多。对于药物难治性癫痫患者,神经外科手术的成功率很大程度取决于癫痫始发区的精准定位。在术前评估中,癫痫脑电信号中的高频振荡节律已成为定位癫痫始发区的重要电生理标志物。由于高频振荡节律的微弱性、瞬时性,且癫痫脑电中混杂其他伪迹和噪声,基于医生肉眼判断的传统高频