评论文本的情感分析方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:kanshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析是自然语言处理领域的一个重要任务,它是一种以提炼文本情感内容为目的的文本分类。根据分析粒度的不同,文本情感分析可以分为对整篇文章的情感分析、对某段话的情感分析和对某段话中各个方面的情感分析,其中,对某段话中各个方面进行情感分析是一种细粒度的情感分析。目前,针对整篇文章或整个句子进行情感分析的研究技术已经比较成熟,并取得了较好的效果。但是,对文本进行整体情感分析会掩盖文本中不同方面的不同情感倾向,而且文本的整体情感并不能反映人们对意见目标的细粒度的情感表达。如果只关注一句话或一篇文章的整体情感,而忽略具体细节,可能会在实际应用中得出有误的结果。对于评论文本来说,同一个文本在不同的方面的情感倾向可能是不同的,有时候往往需要考虑评论文本中某个方面的情感。本文主要研究评论文本的情感分析问题,实现评论文本在细粒度上的情感分析。评论文本的细粒度情感分析存在计算复杂度高、预测准确度不佳等问题,针对这些问题,本文提出一种融合字向量表征和注意力机制的情感分析模型,用于评论文本的情感倾向性分析。本文的主要工作内容如下:首先,本文改进了情感分析的神经网络模型,优化了对评论文本进行细粒度情感分析的方法。为了更好地获取输入文本的情感信息,本文提出了一种融合Word2vec和Fast Text的字向量表征。在融合Word2vec和Fast Text的字向量的基础上,使用基于门控循环单元、卷积神经网络以及最大池化与平均池化的注意力机制的神经网络模型,提取深层次的文本特征,实现评论文本细致极性的情感分类。通过实验的方式将本文改进后的情感分析算法应用到AI Challenger 2018细粒度用户评论情感分析的数据集上,使用其他常用的情感分析算法与本文改进后的算法进行了对比与分析,验证了本文所提出的改进方法的实际效果,可以得出本文所做的改进是有意义的。其次,在算法改进的基础上,本文设计并实现了评论文本的情感分析系统,将改进后的算法应用到了实际系统中。该系统能够判断评论文本在指定方面的情感倾向,按照不同的方面筛选评论文本,并直观地展示出来,从而使用户更加快捷地获取文本的情感信息。
其他文献
面向电子病历的临床术语标准化是将电子病历中的临床诊断实体对应到标准知识库中的标准实体。临床诊断实体的标准化描述主要采用国际疾病分类编码规范(International Classification of Diseases 10,ICD-10)。临床术语标准化是医学自然语言处理中的重要研究课题,是对临床医疗文本进行后续挖掘和分析的基础。目前英文临床术语的标准化研究较为深入,但是中文领域的相关研究相对
在当今科技迅猛发展的时代,智能制造技术所具有的先进性和复杂性更加体现在了现代工业生产过程中,市场竞争也更加激烈,这种复杂的市场环境给制造企业带来了巨大的挑战。科学合理的生产计划和排产调度,对于降低产品成本、提升企业经济效益会产生巨大的作用。因此,对于智能工业制造企业而言,优化车间调度方法是目前的一个研究热点。在智能工业产品零部件制造过程中,企业不仅要考虑到工件的冲压加工工序,为提高产品的强度和韧性
随着汽车保有量的不断增长,智能交通已经深入我们的日常生活,车牌检测作为智能交通中重要的组成部分同样得到了飞速的发展,为城市公共交通的规划与出行带来了极大的便利。由于汽车所处环境极其复杂,为车牌检测识别带来了很大的困难,通过分析大量车牌数据得出光照是影响车牌检测识别的主要因素。通过对车牌识别场景中的实际问题和车牌图像的数据特点的分析,本论文以卷积神经网络为基础框架,重点研究车牌识别过程中的低光照增强
随着互联网技术的日益普及和医学文献数量的快速增长,医学文献数据量呈现爆炸式增长,但大量医学文献数据大多以结构化方式存储,有着不易提取,人工标注成本高昂等特点。在医学文献中,文献摘要记录着重要信息,如何根据大量的医学文献摘要抽取重要的循证医学数据,并分析从而开发合成新的药物来治疗疾病变得愈发重要。医学文献命名实体识别,作为自然语言处理的基础和重要的任务,可以从非结构化的医学文献中抽取规范的实体,可以
随着当今社会信息化和智能化的迅速发展,利用计算机实现以人为中心的各类分析成为了可能。在人机交互、视频监控、医疗防护等应用场景中,准确的人体解析、姿态估计以及进一步的行为识别都是至关重要的。本文使用深度学习的方法,通过对现有的以人为中心的各类分析方法进行研究,寻找其中的不足之处,提出了相应的改进方法。本文的主要研究内容如下:(1)提出了一种用于人体解析的类别感知网络。针对现有人体解析模型的提取特征方
命名实体识别(NER,Named Entity Recognition)是自然语言处理的热点方向之一,目的是识别文本中的命名实体,并将其归纳到不同的实体类型中。命名实体识别是自然语言处理的基础任务,其结果能有效应用于信息抽取、问答系统、文本分类等各项后续任务。命名实体识别的准确度将直接影响自然语言处理中后续工作的表现。随着深度学习的发展,基于长短期记忆网络(LSTM,Long Short-term
作为基础工程的建筑工程建设,在社会经济发展水平中占有至关重要的地位。但是在传统的工程管理模式下,成本控制不是各参与方最关心的问题,而施工方在竣工结算时又想将工程经济效益最大化。因为从设计阶段开始就没有一套规范的项目成本控制流程,施工过程中工程变更屡见不鲜,工程索赔更是常有发生,工程窝工、大规模的赶工期也经常发生,这些现状在传统工程管理模式下会造成工程资源的大量浪费,包括人力、物力、财力。而BIM5
当前随着区块链技术的迅猛发展,区块链机器共识的可靠性日益受到全球各个国家和企业的广泛重视和应用。在中国,区块链技术已经被中央政治局提升到“核心技术自主创新的重要突破口”,以及被国家部委加入“新基建信息技术基础设施”的国家战略高度。很明显区块链技术的重要性越发突出,未来可能会被广泛应用于各行各业。国内很多科技企业都积极关注和发展区块链技术,致力于能在区块链领域有所创新,致力于更深度的区块链落地应用,
信息技术的发展带动了数字医疗的高速发展。数字医疗作为新颖的、现代化程度高的信息化医疗方式,改变了医疗数据的存储与共享方式,极大地促进了医疗发展。在医疗系统实施信息化建设的过程中,如果直接把重要的敏感医疗数据放在云服务器上,当服务器遇到不法分子攻击时,一些重要的数据极有可能被泄露。进而产生隐私信息被非法售卖等一系列的连锁问题。区块链技术具有分布式共享全局账本,公开透明,去中心社区化等优势,能够很好的
随着我国高速铁路的迅速发展,高速列车长期处于高速、重载与高密度的运行条件下,使得钢轨表面的磨损日益严重,可能会引发严重的安全事故,因此钢轨廓形的检测分析及其磨耗测量逐渐成为了铁路工务部门非常重要的检测任务之一。基于结构光的测量技术是如今视觉测量领域的研究重点和热点,已经广泛地应用于工业测量的各个领域,因此基于结构光的钢轨磨耗测量方法已经成为铁路基础设施安全检测中的热点课题之一。本文着眼于如何在动态