基于方面级的文本情感分类研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:flurryzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于互联网以及社交媒体的不断发展,网络上的文本数据呈爆发式增长。研究这些文本数据的情感倾向对于政府部门的舆情监控、企业的产品调研以及商家的商品推荐具有重要意义。早期的文本情感分类方法大多是基于句子级甚至整个篇章级的,这对于需要细粒度分析文本的场景显然是不够的,由此产生了基于方面级的文本情感分类。然而目前绝大多数基于方面级的情感分类方法研究对象均为aspect-term,无法实现对更抽象和更高层方面的情感分析,且这些方法对数据集均有着严格的要求,需要同时标注文本所包含的方面以及该方面在文本中的具体位置,这极大地限制了方面级情感分类的使用场景。针对上述问题,本文提出了一种基于方面级的文本情感分类系统,该系统以aspect-category为研究对象,对数据要求非常宽松,仅需提供文本内容及文本可能包含的方面集合便可得到文本在每个实际包含方面下的情感倾向。本文所做具体工作如下:(1)详细介绍了自然语言处理问题中的ABSA(Aspect Based Sentiment Analysis)任务原理以及目前解决文本情感分类的主流方法,具体包括基于情感词典的方法、基于机器学习的方法和基于深度学习的方法,为后续工作奠定了基础。(2)抽取和识别文本中所包含的方面。该问题可建模为一个多标签分类任务,为了解决该任务本文基于深度学习方法提出了一种基于标签参数的LP-LSTM(Label Parameter based LSTM)模型,通过与CNN、标准RNN和LSTM三种模型进行实验对比,验证了引入标签参数后可以有效提升多标签分类任务的准确率,实验结果最终在数据集上的查准率达到了0.938,查全率达到了0.936,值达到了0.937。(3)面向方面的情感分类。对于已经抽取和识别出的方面,需要针对每个方面分析其情感倾向,本文通过在LSTM网络的基础上引入注意力机制最终实现对于一句文本中所包含的一个或多个方面上的情感预测。通过与LSTM、Bi-LSTM、Bi-LSTM+方面嵌入三种模型进行对比,验证了引入注意力机制后可以有效地利用方面与上下文之间的关系,提高情感分类的准确率,模型最终在数据集上的准确率达到了79.8%,宏F1值达到了0.838。
其他文献
信息化时代下产品更新迭代速度加快,供应链管理作为一种新型的管理模式,凭借其强调系统协同效率的特点给企业带来了更多的竞争优势。然而,供应链的本质是一种动态联盟,具有系统运作环节复杂、不确定性因素多、参与主体多元化及地域分布跨度大等特点,同时也给企业带来了更多的风险。尤其对处于供应链中弱势地位的中小零部件企业而言,资源匮乏、管理经验不足,更容易受到供应链风险的冲击。本文将中小零部件企业作为研究对象,从
随着电力电子变换器的应用场景日益关键,人们对其可靠运行的要求越来越高。电容是变换器中最容易失效的器件之一,其特征参数C或ESR的变化反映了电容的健康状况。通过在线检测电容参数,可实时掌握电容的老化情况,及时处理并更换失效电容,对于提高变换器工作可靠性具有重要意义。本文以使用铝电解电容的Boost PFC变换器为研究对象,提出两种在线检测其输出电容C和ESR的方法,主要内容如下:1在现有交流信号注入
PPP(Public-Private-Partnership),在我国也被称为政府与社会资本合作。因为PPP模式是一种为提供公共产品或服务而引入社会资本投资的创新模式,能实现缓解地方政府财政压力的目的,近年来在我国被大力发展。随着大量PPP项目入库,提高项目绩效水平成为重要研究问题。但在实践中,从PPP项目清理退库工作中可以看出,政府作为参与方,其财政能力可能会影响PPP项目绩效评价结果甚至项目成
公共资源交易日益成为国家深化改革的重点领域,是提升政府监督管理能力和水平的重要体现,也是防止权力寻租和滋生腐败的重要环节。近些年来,随着我国公共资源交易监督管理工作的不断规范,使得资源配置效果成效显著,充分释放了公共资源交易市场活力。但仍然存在着监督管理制度不完善、监督管理职能分散、交易乱象丛生、事中事后监管机制薄弱等问题,导致违法违规现象易发多发。因此,亟需建立与完善公共资源交易监督管理体系,通
滚动轴承是很多机械设备中非常重要的零部件。保证轴承的正常运转、及时发现滚动轴承的故障类型具有重要的经济价值和意义。本文以滚动轴承为研究对象,以实现一种能够对滚动轴承进行故障诊断的方法并将其应用到齿轮箱典型故障仿真软件中为目标,做了如下工作:(1)针对EMD分解适用于处理非平稳的振动信号的特点,研究了该方法及其改进方法EEMD在信号分解方面的应用。由于EEMD方法分解出来的分量仍然存在模态混叠问题和
行人检测作为目标检测的子问题,是计算机视觉领域的热门研究方向之一,在自动驾驶、视频监控、安防等领域有着巨大的应用价值,所以许多企业、高校都针对行人检测问题开展了研究。由于行人目标受许多因素影响,行人检测仍旧有很多困难和挑战:(1)行人检测需要很高的实时性来满足应用需求;(2)小尺寸行人(高度小于60像素)难以检测;(3)行人常常存在重叠、遮蔽。基于以上问题,本文重点研究了基于YOLOv3网络进行改
近年来,云计算、大数据分析的应用发展迅猛,云数据中心是支撑它们的重要基础设施。在云数据中心中,云计算和大数据分析相关的数据主要在数据中心内部服务器和存储系统之间传输,消耗了大量的网络带宽资源,对数据中心网络拓扑结构和带宽资源分配带来巨大挑战。本论文旨在通过对云数据中心内部网络流量特征和网络资源消耗的分析,利用SDN网络全局状态感知、动态策略部署的优势,实施网络流量负载均衡策略,来优化云数据中心中带
缸内直喷汽油机(GDI)凭借其精准的控制喷油策略,以及高效率、低油耗和低排放的特点,逐渐得到研究推广。但由于直喷汽油发动机采用了较高的压缩比,使得缸内热负荷与压力大幅增加,易引发爆震现象,极大地制约了发动机性能的提升。由于水具有较大的汽化潜热且能参与一系列燃烧化学反应,因此将喷水技术运用到发动机中能有效地抑制爆震的发生。本文笔者采用数值模拟的方法研究进气道喷水对缸内燃烧的影响,首先通过调整余隙容积
在土地资源约束与经济发展转型的背景下,城市低效土地再开发成为城市更新的重要载体,而对于低效工业用地的收购成为企业一项重要商业行为。在新增建设用地有限的前提下,如何盘活存量土地成为各地方政府面临的重要问题。已有城镇低效用地再开发工作调研结果显示,在城镇改造地类中工矿仓储比例最高,尤其是大量低效工业用地“盘活潜力”巨大,对低效工业用地的收购已经成为城镇低效用地再开发的重要组成。对于土地收购企业来讲,由
近年来,随着经济社会的发展,大量燃煤和石油等化石能源的使用使环境污染和能源紧缺问题愈发突显,人们对氢能、风能、太阳能等清洁的能源需求更加迫切。光催化材料由于其环境友好性以及潜在的环境处理能力和光解水产氢能力被认为是一种新的能源短缺解决方案。铋系化合物半导由于其特殊的层状结构,具有特殊的物理性质和化学性能因而受到广泛的研究,被认为是一种理想的光催化材料。Bi2O2CO3作为一种铋系化合物半导体,具有