英文评论文本的情感分类和评价对象识别研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:bigtree16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着电子商务和社交媒体的迅速发展,越来越多的人活跃于网络中并产生海量文本数据,其中包含着大量的情感信息,为了挖掘和获取文本中有价值的情感信息,产品评论文本的情感分析研究受到越来越多的关注。文本情感分析是挖掘人们在主观性网络文本中表达的态度、情绪。本文考虑到在判断文本的情感倾向时不同句子的重要程度不同,对英文评论文本进行基于关键句抽取的情感分类。同时,本文对评论文本中细粒度的评价对象进行识别,使情感分析工作更加细化。具体研究工作如下:在基于关键句抽取的情感分类研究中,针对已有的方法大都是基于特征属性权重抽取情感关键句,忽略了Title和上下文信息的问题,本文提出了基于Title和加权TextRank抽取关键句的情感分类研究。首先通过两个途径抽取情感关键句,一方面构建扩展语义规则模板和情感词典,基于此计算Title的情感得分,从而判断Title的贡献度,以此来决定Title作为情感关键句的条数;另一方面,根据加权TextRank算法思想,在文本正文中构建一个情感句加权有向图来提取关键句,并详细介绍了四个影响有向边权重的因素。然后将情感关键句、细节句和全文句得到的情感分类结果分别作为特征,利用xgboost算法进一步对文本情感倾向进行判定。最后实验结果表明本文提出的关键句抽取算法能极大程度上提高情感分类效果,并验证了情感关键句的优势及其和细节句的互补性。在评价对象的识别研究中,针对统计学习方法中特征要人为设定和深度模型依赖大量标注数据、缺乏先验知识的问题,本文提出了融合知识指导和并行模型进行集成学习的评价对象识别研究。首先构建拼接词向量作为模型的输入,由三部分组成:特征词向量、Glove词向量和Elmo加权平均词向量,其中特征词向量中嵌入了产品名领域词典。然后构建了四个并行的深度模型进行集成学习,每个个体深度模型由以下几部分组合组成:双向长短期记忆模型LSTM、注意力模型Attention、条件随机场CRF或Softmax函数。再利用并行模型识别结果和词性、句法分析树关系等先验知识,提出融合知识指导的规则模板来改进投票策略。最后实验结果表明本文构建的并行个体深度模型的有效性及融合知识指导的规则模板改进投票策略的高效性。
其他文献
目标跟踪算法是计算机视觉领域中最重要的任务之一,其在辅助驾驶系统、目标行为分析及智能视频监控等实际场景具有重要作用。视觉目标跟踪需要在视频序列中持续精准地预测目标的位置以及尺度变化,确定目标的运动速度、方向和轨迹等动态信息,从而完成更高级的视觉任务。由于被跟踪目标往往存在部分或完全遮挡、尺度形变、背景杂乱等复杂因素的干扰,因此建立一个通用且鲁棒的视觉跟踪系统仍然存在巨大挑战。本文提出了一种基于全卷
本文以货币政策调控广义价格目标作为研究对象。从已有文献来看,一些研究通过构建包含资产价格波动的指数如FCI,将指数纳入到货币政策规则中来进行分析。本文发现通过构建包
由于移动互联网和通信技术的高速进步和发展,使得21世纪的人们正处于一个所谓信息数据大爆炸的时代。面对现阶段浩如烟海的互联网信息数据,用户会发现想要在网络上找到自己真正需要的信息不是一件容易的事情。在这样的互联网背景下,推荐系统诞生了。这种推荐系统本身就是一种推荐算法,能够有效地替代搜索算法,可以有效地帮助更多的用户找到一些自身需要或者可能比较感兴趣但无法在网上找到的信息或物品。协同过滤算法作为目前
量子码因其在量子计算与量子通信中的应用吸引了众多学者的关注,许多学者利用具有自正交性质的线性码进行量子码的构造。近年来,利用环上的常循环码构造参数优的量子码成为了
污水脱氮一直以来都是人们倍加关注的问题。最近几年发现了一类与传统自养硝化反硝化菌功能不同的脱氮菌种,同时具备着异养硝化和好氧硝化反硝化功能,可实现同步硝化反硝化(Si
全芳族液晶聚酯以其出色的耐热性、优异的机械性能、突出的尺寸稳定性和化学稳定性而成为制造电缆、航空航天复合组件等装备的基础材料。但是,高熔体粘度和高晶体-向列相转变
全国中小企业股份转让系统(新三板)作为我国多层次资本市场建设的重要一环,自2013年12月扩容至全国以来,在制度红利、政府补贴、企业直接融资需求、机构与个人投资者海量资金
热电效应包括塞贝克(Seebeck)效应和能斯特(Nernst)效应,能够敏锐地反应费米面的拓扑结构信息,在凝聚态科学领域被作为一个强有力的手段探测研究拓扑相变、量子相变、自旋激发和
现如今经济发展越来越快,城市化的发展水平不断提高,在城市里居住的人们回归大自然的愿望越来越强烈,人们向往乡村,渴望远离城市的喧嚣,回到天真无邪的境地。在这一背景下,乡
视觉跟踪作为计算机视觉中的一个重要研究课题,不仅推动了机器学习和人工智能等领域的理论研究,也成为很多工程应用如智能交通、人机交互中必不可少的一个环节。随着人工智能的发展,视觉跟踪的研究已经取得了长足进步。但是目前跟踪过程中面临的很多问题比如准确区分相似的目标和背景、运动中目标的遮挡和形状变化等都对跟踪的结果产生影响。在大多数视觉跟踪任务中,目标是由第一帧的边界框给定并跟踪的,但是边界框内不可避免地