基于深度学习的方面情感分类方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:puhongzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的发展,人们在网络分享自己的生活,发表对各种事物的看法,各种社交平台和电商平台的用户评论呈爆炸式增长。如何从众多评论中提取出用户对产品或服务在某个方面的具体情感,对商家改进自家产品与服务,以及指导其他用户选购商品都极具现实意义。方面级情感分类任务旨在识别句子中给定方面词的情感极性,从更加精细的角度分析文本评论中不同属性或者方面的情感信息,从而对商品和服务有更加深入、细节的了解。本文针对方面级情感分类任务展开研究,主要研究内容及贡献如下:(1)以往的方法大多基于长短时记忆网络(LSTM)和注意力机制,这种做法很大程度上仅依赖于建模句子中的方面词与其上下文的语义相关性,但忽略了句中的语法结构。针对这种缺陷,提出了一种基于图卷积网络(GCN)和注意力机制的方法,不仅利用双向长短时记忆网络(Bi LSTM)建模了句中单词之间的语义信息,还利用图卷积网络进行单词间语法关系的信息传递,最后通过注意力机制建模上下文和方面词之间的关系,用于情感分类。(2)与前面提出的方法类似,现有的几种同样使用图卷积网络传递语法信息的方法,其主体思想是基于依赖关系树的图卷积方法从语法关系上缩短方面词和观点词之间的距离,并利用句子间的语法关系进行信息传递。一方面,这种方法高度依赖语法解析工具,一旦解析错误就不可避免地会导致错误的积累。另一方面,现有的语法解析工具无法很好地解析较长的句子,对于一些特殊句式,如双重否定句、反问句等也无能为力。为了充分利用句子的语法依赖,同时缓解由于解析错误而导致的问题,提出了一种基于交互注意力的图卷积神经网络(IAGCN)的方法,深度建模了句子与方面词的语义信息和语法信息。首先用双向长短时记忆网络学习句子的词序关系,捕捉句中上下文的语义信息;其次引入位置信息后,通过图卷积网络学习句中的语法信息;然后通过一种掩码机制提取方面词;最后使用交互注意力机制,交互计算特定方面的上下文表示,并作为最后的分类特征。通过这种优势互补的设计,模型可以很好地获得聚合了目标方面信息的上下文表示,并有助于情感分类。实验结果表明,模型在多个数据集上都获得了优秀的效果。(3)最后,对整个实验的工作流程进行了可视化,从数据集中选取了各具特色的例句,系统性地分析了省略句、否定句、插入语等不同句式下的方面情感分类任务的难点,并设计并搭建了一个方面级情感分类系统平台,验证了本文设计模型的可用性。
其他文献
现今的药物研发工作所消耗的人力物力、时间和资金都变得越来越多,并且每年的申报名额也在逐年减少,药物研发工作变得越来越难以开展。得益于前人的科研工作经验的总结和大数据化的数据交流的发展,人们逐渐倾向于寻找一种成本低、效率高的方法应用于药物的研发初期,为现有药物提供高置信度区间的潜在适应症,这种技术被称为药物重定位。虽然目前已有不少科研人员提出了极具研究价值的预测模型,然而,在药物相似性和疾病相似性的
学位
多标签学习(multi-label learning,MLL)是监督学习的一种,但与传统监督学习不同的是,在多标签数据中,一个示例往往与多个标签相关联。多标签学习中,一个对象往往可以通过多个方面来描述。例如,在网络图像检索中,一幅图像可以使用图像的视觉特征集或者图像周围文本的文本特征集来进行描述。在这些应用中,一个对象与多个视角相关联,并且每个视角都从不同的方面来描述同一对象。因此,如何利用多视角
学位
中医智能处方推荐指利用人工智能技术,根据患者病历信息进行学习,对候选中药进行预测,以模拟医生开具处方的过程。近年来许多学者围绕中医处方推荐开展了相关研究,但目前领域内仍存在亟待解决的问题,如现有临床诊疗数据具有“一多一少”的特点、无法对临床表型中的“未登录词”形成表示、现有处方推荐方法性能较低、现有方法推荐结果的配伍合理性不强等。为解决上述问题,本文围绕中医处方推荐开展了以下三方面研究。第一,针对
学位
资源分布情况复杂,资源指派涉及到较多的影响因素,合理划分空间以评估资源数量及利用资源,使得空间呈现出明显的多维特性,例如城市交通网络划分和物种集聚地划分等。为了在资源有限的情况下,根据服务对象的相关需求,高效利用资源,保证空间主体划分和客体资源利用的利益最大程度,本文主要研究多维空间中资源分配的指派问题,通过任务属性划分空间网络,避免资源分配和使用的效益因空间约束过度耦合而降低。合理分配相应的资源
学位
文本摘要生成是解决信息过载问题的有效方法之一,在新闻标题生成和知识科普领域有着广泛的应用。文本摘要生成是指从源文本中提取能准确代表原文内容的简短概述,主要分为抽取式摘要和生成式摘要,生成式摘要较抽取式摘要具有更高的灵活性,成为目前文本摘要生成的研究热点,但生成式摘要还存在问题,例如,未登录词、生成重复、暴露偏差等,导致生成的摘要并不理想。本文针对上述问题,基于序列到序列框架,利用指针生成网络和强化
学位
现实世界中存在各种能够用图表示的数据,图作为一种复杂的数据结构类型,能够很好地表征不同对象间的复杂关系。对图进行分类是一个十分重要且富有挑战性的问题,在生物医药等领域具有广泛的应用,如化学分子性质预测和新药物研发等。早期针对于图分类的研究,主要是通过计算图与图之间的相似度的方式来判断图是否属于同一类别,例如统计图中特定子图的数目。但是由于需要一定的先验知识来选择合适的子图结构,所以很难应用到不同领
学位
如今,多维时序数据越来越多地被收集到各类信息系统中,为完成各种数据挖掘任务提供数据基础。然而,该类数据维度更高,无效的信息干扰也更为严重,使得对于多维时序数据的研究面临极大挑战。其中,针对多维时序数据建立有效的异常检测模型,是当下数据挖掘研究及应用的重点。目前研究者们已对该类问题提出多种解决方案,但仍然存在一定局限性。首先,异常检测领域的数据标签稀少,人工标注成本过大,导致监督方法在现实世界的异常
学位
近年来,随着人们生活的多样化,应用穿戴式相机拍摄被广泛地应用在日常生活。目前,基于穿戴式相机的第一人称视频动作识别已成为计算机视觉研究的热点问题。与第三人称视角的相机相比,第一人称视角的相机可以捕捉到穿戴者的操作画面中心,更贴近人类的视觉观察,为智能机器人的发展提供了帮助。本研究通过第一人称视频探讨人类动作行为,结合手部骨架数据和RGB数据,提出动作识别的深度学习框架,并设计一个从演示视频中学习机
学位
近几年来机器人产业快速发展,制造业发展愈发智能化,在逐渐释放人力的趋势下,机械臂逐渐取代人工从事繁杂不能及或者更加精细的工作。随着机械臂的工作环境越来越复杂,实际应用环境中的场景杂乱,目标对象和其他相似物体堆叠,目标的位置姿态复杂多变等问题都为机械臂的抓取、拣选等任务造成了巨大的困扰。因此,研究目标的6D位姿估计对精确的完成这些任务具有重大的研究意义。本文以弱纹理工件的位姿估计为目的,设计工件杂乱
学位
信息物理系统(Cyber Physical System,CPS)是工业4.0中的重要组成部分,能够在未来的设计和开发中发挥重要作用。其通过对计算,网络与物理环境的综合,实现了计算资源和物理资源的结合协调。但CPS在给人们带来便捷的同时也带来了信息超载的情况,若能对这些多源巨量数据加以利用,将能进一步便利人们的生活。协同过滤推荐算法是解决信息超载的有效方案,其通过对现有用户交互数据进行处理,提取相
学位