基于对抗训练的文本情感分析研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:c1093682
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交软件和电商平台等应用的蓬勃发展,存在于这些应用的海量文本数据蕴含着大众对某些热点事件的情感态度,对文本数据进行情感分析,挖掘其包含的情感态度在舆情监控和策略制定等方面具有深远意义。传统的文本情感分析方法为挖掘情感态度提供了技术支持,但系统的鲁棒性较低,在文本被恶意添加扰动或被破坏时,对情感分析系统会造成一定的干扰,从而导致结果的误判。为了提高文本情感分析系统的稳定性和准确性,本文重点研究在强鲁棒性前提下的文本情感分类问题,具体的研究内容如下:(1)针对文本情感分析系统鲁棒性不高的问题,本文提出融合对抗训练和对抗Dropout方法的文本情感分析模型。采用对抗训练在输入层对文本添加对抗扰动来训练对抗样本,同时在网络的隐藏层进行对抗性Dropout,以动态遮蔽适当数量的神经元,从而提高模型鲁棒性和情感分类效果。(2)为了在强鲁棒性的条件下进一步提高情感分类的性能,本文提出结合注意力机制与对抗训练的文本情感分析模型。注意力包含基于情感词的全局注意力机制和基于自适应尺度的局部注意力机制,前者既关注到情感词又保留了文本信息的完整性,后者既可以自适应地选择合适的尺度又捕捉到重要的局部信息。将两种注意力机制与融合了对抗训练和对抗Dropout的方法进行结合,不仅可以提升情感分类的性能,而且不明显增加训练时间。(3)针对文本特征提取器单一性的问题,且为了进一步提升情感分类的性能,本文提出结合循环自注意力机制与对抗训练的文本情感分析模型。使用基于循环自注意力机制的模块代替循环神经网络和卷积神经网络作为文本特征提取器,并在该模块中使用残差网络结构以保证深度网络的性能。同时将该模块与融合了对抗训练和对抗Dropout的方法进行结合,确保模型在强鲁棒性的前提下提升情感分类性能。在IMDB、ELEC和MR数据集的实验结果表明,本文方法有效提高了模型的鲁棒性和分类性能。
其他文献
在系统梳理国内外相关研究文献的基础上,对高管薪酬、盈余管理和审计费用之间的关系进行了理论分析和假设推演,实证分析了盈余管理与审计费用的关系,高管薪酬与盈余管理的关
胡锦涛新闻思想是中国共产党新闻思想的重要组成部分,是对以毛泽东、邓小平和江泽民为代表的三代领导集体智慧的深化和开拓。作为中国共产党第四代领导集体的代表,胡锦涛继承
改革开放三十年来,我国经济飞速发展,城市化建设迅猛,创造出了令世人瞩目的经济发展奇迹,人民生产生活条件也得到了很大的提高。但我国人均收入水平仍居世界下游水平,城乡差距明显
本文关注的是当代认识论中的辩护理论。在盖悌尔问题出现之后,认识论的JTB传统受到了严重的挑战。人们处理的方式大致上分为两种,一种路径是在坚持传统的基础上进行改良,他们
自2005年中国证券管理委员会发布《上市公司股权激励管理办法(试行)》以来,上市公司股票期权的发行有了更加明确的规范,中国上市公司股票期权的发行和实施步入正轨。目前,股
师德提升必须依托相关课程和实践活动来内化和发展,顶岗实习就是重要途径之一。根据顶岗实习生教师职业道德知识相对匮乏、教师职业情愫不足的现状,构建教育方略,明德——强
传统的Internet应用主要是以数据传输为主,网络只提供尽最大努力的服务;然而随着网络中对实时性要求的多媒体业务的不断增多,传统的尽最大努力的服务不能满足于这些多媒体应用的
以问卷调查的形式,对部分中学生利用图书馆资源进行英语学习的态度进行调查分析,并通过学生学习前后态度的对比,证实在当前基础教育改革模式下英语教学中开发利用图书馆学习
报纸作为社会系统的一部分,和其他社会系统存在密切的联系,这种相互联系的总称就是报业生态环境。报业生态环境是由报纸所处时代的社会、经济、政治、文化等各社会系统所决定
随着新课程改革的进行,如何提高课堂教学效率已经成为物理教师讨论的热门话题。作为教师,应在实际的教学中结合初中生的年龄特点和性格特点,采取积极有效的教学策略,面向全体