基于主题特征和深度学习的微博情感分析研究

来源 :华北电力大学(保定)   | 被引量 : 0次 | 上传用户:lwsun_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网产业的快速发展,社交网络自媒体时代的到来,微博作为一种以信息发布、互动交流为主的广播式社交网络平台,消息传播速度快范围广。对海量的微博文本的进行情感分析,挖掘用户对商品、新闻、能有效的了解用户的喜好,监控社会舆论走向,具有重要的意义。情感分析是自然语言处理领域的一项重要任务,已经成为当今热点研究方向。深度学习不同于传统的设计网络,基本不需要人工辅助,通过学习数据的浅层属性和特征,总结规律通过多多层级的处理网络,逐步提取到数据的深层特征,所以基于深度学习的方法已经成为目前文本情感分析的主流方法。目前的微博文本情感分析方法大多缺乏对文本主题特征的关注,而对于短文本而言,增加对与主题相关特征的关注度,可以更好地挖掘主题信息。
  针对以上问题,本文提出一种基于主题特征和双向GRU网络的情感分类模型来进行微博文本情感分析,进行训练和测试,并获得较好的效果,在情感分类效果和分类速度上都有有效提高。针对关注文本主题特征对情感极性的影响,综合考虑作者主题特征和主题词汇特征的重要程度,引入注意力机制,构建基于注意力机制的双向GRU情感分类模型(ATT-BiGRU),通过对比实验,证明注意力机制有效地提高了模型的分类效果。针对不同的情感分析任务,利用不同的主题模型,考虑不同任务中主题模型的作用,从而进行建模,通过参数调整来改善分类效果。
  实验表明,本文的方法具有一定的有效性和可行性,在微博的情感分析任务上表现出良好的效果。
其他文献
绝缘子是输电线路中的重要设备,其运行状态直接影响电力系统的稳定性和正常运行。因此需要采用智能化的方法对无人机获取的大量绝缘子图像数据进行处理和分析,为电力巡检提供可靠的参考信息。本文针对绝缘子故障分类这一任务,从以下两个方面展开研究:  (1)绝缘子故障分类的前提是在绝缘子图像上准确地识别和定位出绝缘子。因此,本文首先对基于卷积神经网络的绝缘子识别算法展开研究。针对使用FasterRCNN目标检测
学位
随着国内外电动汽车行业的快速发展以及电动汽车数量的迅猛增长,使得对电动汽车充电桩的需求量日益增大,所以对充电桩的管理和维护就成了充电桩运营的一个重要问题。由于电动汽车充电桩市场存在信息管理不够完善、维修人员意识淡薄、缺乏及时有效应急措施等问题,无法全面及时对电动汽车充电桩质量进行评估,从而造成充电桩故障频繁发生,造成了大量的损失。电动汽车充电桩可靠性问题不容忽视,因此,寻找一种有效的方法对电动汽车
区块链技术作为去中心化的颠覆性技术,在近几年里得到了许多专家学者的深入研究。以区块链技术为基础的应用迅速普及开来,涉及金融、知识产权保护、身份认证、物联网以及医疗等众多领域。共识机制作为区块链中的关键技术之一,研究共识机制的安全性以及改进现有共识机制的缺点对于区块链技术的进一步推广具有非常重要的意义。  本文针对区块链中的共识机制进行研究,重点研究区块链中使用PoW共识机制引起的区块链分叉现象。首
随着智能电网和泛在电力物联网的快速发展,电力系统已经进入了电力大数据时代,而传统的风电机组关键部件故障诊断模型多是基于单机、小样本的诊断方法,不能满足大数据时代大数据量级的故障诊断需求;传统的基于振动数据的诊断方式,需要安装传感器等设备,诊断成本居高不下。而大数据存储和处理技术以及SCADA数据为其提供了新的解决方案。该课题构建了包含spark、Hadoop等在内的云计算平台,选取大量的风电机组S
图像描述是计算机视觉和自然语言处理交叉而衍生出的新兴领域,可在人工智能时代诸多场景中应用,结合实际领域进一步开发还可以协助教育和医疗等行业更快的进入智能化时代。因此本文提出基于注意力机制的图像描述方法,利用了图像特征提取技术与描述生成技术,不仅提高机器处理图像的效率,还可以生成准确高的图像内容描述。本文主要做了以下几方面的工作:  介绍了图像描述领域的发展和研究现状,通过梳理该领域的由来和发展过程
学位
双目立体视觉在人工智能领域研究中占有重要的地位,是计算机视觉研究中的一个重要分支,广泛应用于机器人导航、视频监控、医药诊断、军事侦察和无人驾驶等领域。双目立体匹配模拟人类双眼看到事物在大脑中进行信息处理的原理,利用像素匹配方法确定双目相机获取的左右两目图像中各像素间的对应关系,计算三维空间中的深度信息,最终通过图像的角度、颜色、边缘特征等信息把物体的平面图像还原成三维立体场景,以达到从平面到立体的
近些年来,农作物产量预测已经成为农业科学领域的研究热点,对解决粮食生产问题具有关键性作用。因此准确、及时地对农作物产量进行预测对国家制定相关粮食政策具有重大意义,同时为农业决策提供了合理的依据,也为农作物改善措施提供重要根据。通过预测得到的结果可以有针对性地观察农作物的生长周期、土壤变化、雨水分布等因素对农作物产量的影响。传统的农作物产量预测方法尽管能获得一个农作物估产值,并在一定程度上反映农作物
学位
随着二十世纪互联网的迅速发展,网民规模高速增长,人们开始习惯在网上交流,发表自己对某件事情的看法。在这些信息的背后,隐藏着巨大的商业和社会价值。情感分析就是针对这些网上评论的情绪倾向性进行的一种数据分析和处理,目前已经成为工业界和学术界的一个重要任务。但现阶段情感分析任务仍存在对关键信息学习不充分,情感分类准确性不高等多方面的问题。  针对目前情感分析模型存在的提取关键信息能力不强,无法有效捕捉特
学位
变电设备是电力系统中最重要的一类设备,其故障能否快速而准确的诊断将直接影响到网供电可靠性和系统的安全运行。持续在线的电网监测数据给传统的数据处理方式提出了挑战,电力系统已经进入“大数据”时代。Storm作为流数据的分布式处理框架具有实时性和可扩展性等优势,可以满足电网数据的实时、持续的监测需求。本文研究了基于Storm的局部放电信号的并行分解方法,改进了在线序列学习机算法,同时研究了模型标记语言和
在智能电网中,智能电表实时采集用户的细粒度用电信息并周期性发送到控制中心,控制中心利用采集到的用电信息进行发电预测、实时定价及需求响应。由于用户的细粒度用电信息包含个人隐私,如若发生用电数据泄露将会影响用户的使用,从而制约智能电网的发展。因此,信息安全是智能电网稳定运行及发展的前提。本文围绕认证、数据完整性、机密性及保护用户数据隐私等确保智能电网安全稳定运行的要求设计了如下方案。首先,提出了一种高
学位