基于神经网络的用户评论细粒度情感分析研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:ivsou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的发展,电商等平台涌现了大量的用户评论信息,这些信息传达了用户的观点与情感,对消费者和商家的决策制定具有重要意义。情感分析是通过对用户评论的整理、归纳、分析出用户表达的情感。相较于对整个评论句判断情感倾向,细粒度情感分析是以句中涉及到的每一个评价对象为主体,判断基于特定评价对象的情感倾向。这种情感分析方法对情感的判断更为准确,也更具应用价值。细粒度情感分析包括两个子任务,分别为评价对象提取和评价对象情感分类。为了在海量的评论中挖掘情感信息,需要研究自动化的文本挖掘方法,以减少整理和分析数据的时间。随着基于神经网络的方法在自然语言处理领域的应用,研究发现该类方法可自动捕获有效的文本特征,解决了传统方法依赖于语法规则和特征工程的问题。本文针对细粒度情感分析的两个子任务,分别提出了基于神经网络的模型:(1)评价对象提取旨在标注用户评论中的评价对象,该任务可看为序列标注任务,输出的序列标注为B-I-O模式。该标注模式存在一定的规律约束,如标注O之后不会直接出现标注I。针对已有方法未将标注的约束规律考虑到模型中的问题,提出了基于历史序列注意力机制的模型。首先利用通用词向量与领域词向量构建输入矩阵。然后利用卷积神经网络对文本建模。其次利用历史序列注意力机制将前文的重要特征与当前特征融合,以达到历史标注约束当前的标注目的。最后将输出特征通过分类器,实现输出序列的标注。实验表明,该模型在多个数据集上的F1指标均有一定的提高。(2)评价对象情感分类旨在判断已知评价对象的情感极性,常见的模型结构是基于注意力机制的循环神经网络。考虑到评价对象常与评价词的距离较近,而循环神经网络会将远距离信息引入当前特征中。并且,循环神经网络无法平行处理数据,对上下文表示也不够充分。为解决上述问题,提出了基于注意力机制和多层卷积神经网络的模型。该模型首先利用卷积神经网络平行地处理上下文,并利用多层结构实现对上下文的多次建模。然后模型利用注意力机制显示地获取每种上下文特征矩阵中相对于特定评价对象而言的重要情感信息。最后将这些情感表示融合在一起,输入到分类器中,即可判断情感极性。实验表明,该模型在多个数据集上的准确率均有一定的提高。最终,利用上述两个模型实现细粒度情感分析,实验表明本文模型在公共数据集上的F1指标有一定的提高。
其他文献
宋代是中国陶瓷的第一个高峰期,主要表现是官、民两大系统都是蓬勃发展。而宋代陶瓷美学追求的高度,前无古人后无来者,后来的陶瓷美学中,没有哲学因素的存在了。宋瓷有两大系统,一个是官窑系统,就是我们常说的宋代五大名窑;还有一个民窑系统,分为八大窑系。宋代的五大名窑和民窑的八大系统,只有官窑和哥窑的命名方式是特例,其他都是以窑口地址作为命名的依据。汝窑不用说了,就是宋代汝州所烧的窑;定窑,就是定州所
期刊
开发能在复杂地形进行探险、救援和辅助运输的腿式跳跃机器人是当前机器人研究的一个热点,并且已经有了许多研究成果。良好的跳跃能力是此类机器人能够胜任复杂地形工作的必要条件。为开发可高效跳跃的机器人,本文对具有高效、省能、灵活跳跃能力的家猫跳跃机理进行了研究,并根据仿生原理和机器人学知识进行了仿猫跳跃机器人的设计和研究。所做工作具体如下:1)对家猫的跳跃运动和相关生物机构进行了研究。通过对家猫骨骼-肌肉
由于传统搜索方法对岩质边坡滑裂面的确定无法兼顾效率与精度,如何迅速准确确定潜在滑裂面仍然是个难题。极限平衡法在岩质边坡稳定性分析中备受认可,采用岩质边坡平面剪切滑动模型,以滑裂面的倾角来表征潜在滑裂面的位置;基于极值法,推导了极限平衡条件下平面剪切破坏型岩质边坡潜在滑裂面的解析解,并结合香港秀茂坪路边坡对其准确性进行了验证,进一步对四川宜宾打营盘山公路多级边坡进行了整体稳定性分析。结果表明:香港秀
随着现代工业生产的飞速发展,在航空航天、汽车产业中机器人焊钳设备的应用越来越广泛,其作用举足轻重,为保证航空航天和汽车等制造业焊接工作高效、高质量的进行,实现“零次品”、“零缺陷”的产品管理目标,许多企业将注意力更多的集中到了设备性能的保障上,在确保机器人工作站安全、平稳、可靠、长周期运行的基础上,迫切需要基于过程参数的信息反馈系统以对机器人焊钳的健康状态进行评估并完成对其性能的检测,不断优化设备
光伏电池缺陷的存在不仅会影响其发电效率、产品质量,还会降低光伏电站发电的安全性。目前电池片的缺陷检测更多依赖于人工检测,存在效率低、工作强度大、成本高的缺点。因此,实现高效率、高精度的电池片裂纹检测具有重要的意义和价值。现如今,机器视觉的发展推动了智能缺陷检测技术的发展,受生产工艺、运输方式等因素的影响,光伏电池近红外图像的背景复杂,且裂纹缺陷表现出形状各异的多尺度特征,使得基于人工设计特征的传统
图像检索任务的目标是从海量的遥感图像中搜索到与查询图像相似的图像。与自然场景下的图像不同,遥感图像多为俯视图,并且携带更多的波段信息,因此需要较高的特征维度来表达,导致检索效率低。近年来,深度哈希方法在特征降维方面应用广泛。然而,与自然图像相比,遥感图像的相似、相关性大,类间距小,使深度哈希方法在遥感图像检索的应用受限。为了提高哈希码的质量,使检索结果更准确,本文对基于深度哈希的遥感图像检索方法进
近年来,风力发电因其清洁、安全及稳定的特点不断发展,风电装机容量与发电量的占比正呈逐年递增趋势发展,但随着风电行业的快速发展,风电机组滚动轴承的故障诊断随之呈现出检修维护成本高、耗时长、准确率低等弊端。由风电机组滚动轴承引发的重大事故时有发生,严重影响风电机组的发电效率与电能质量。因此,开展风机滚动轴承故障诊断研究具有重要理论意义和工程价值。首先,介绍了风力发电机组滚动轴承的原理及其振动频率,接着
天车系统被广泛的用于工业生产现场以及仓储、运输环节,在工业应用中占有举足轻重的地位。如今,随着天车正在向着大型化、智能化、快速自动化、准确化等的方向快速发展,其运输工作的性能与运输的可靠性也在日益得到提升,智能天车系统的控制难点之一在于如何在保证运输效率的同时减小天车负载的摆角幅度,天车系统的负载与台车之间通过钢缆连接,天车系统仅能通过控制台车的行驶轨迹来间接的控制负载的摆角幅度,天车系统的运行环
4月1日出版的第7期《求是》杂志发表了中共中央总书记、国家主席、中央军委主席习近平的重要文章《坚持把解决好“三农”问题作为全党工作重中之重,举全党全社会之力推动乡村振兴》。文章强调,巩固拓展脱贫攻坚成果,全面推进乡村振兴,加快农业农村现代化,是需要全党高度重视的一个关系大局的重大问题。全党务必充分认识新发展阶段做好“三农”工作的重要性和紧迫性,坚持把解决好“三农”问题作为全党工作重中之重,举
期刊
随着工业4.0的不断推进,国家综合国力之间的竞争逐渐转变为智能制造业之间的竞争,而衡量制造业的标准就是制造业产品的设计水平,因此数控机床作为工业母机的设计重要性日益突出,其色彩设计也成为目前研究的重点。过去的产品色彩设计因技术有限呈现技术主导的设计,随着智能化、自动化的不断发展,现在的产品色彩设计逐步转向以人的情感需求为主导的设计,然而目前的设计形式主要是先确定单一色彩布局形式再进行色彩情感化设计