基于混合神经网络和BERT的文本方面级情感分析研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户：liongliong588

【摘要】

：

随着互联网技术的发展,人类社会正迈进高度智能化和信息化阶段。文本作为凝练的信息载体,一直都是人们信息交流的主要媒介。目前互联网上积累了海量文本数据,其中包含了人们

【作者】

：

王昆

【出处】

：

华中师范大学

【发表日期】

：

2004年期

【关键词】

：

情感分析方面级注意力机制混合神经网络 BERT

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的发展,人类社会正迈进高度智能化和信息化阶段。文本作为凝练的信息载体,一直都是人们信息交流的主要媒介。目前互联网上积累了海量文本数据,其中包含了人们对商品、服务各方面的情感倾向。研究文本中的情感倾向能够帮助商户或服务提供方做出相关决策,具有重要商业价值和学术研究意义。近年来,文本方面级情感分析(Aspect-based Sentiment Analysis,ABSA)备受学者们的关注,其旨在分类出文本在不同方面上表达的情感倾向,更加贴近实际应用。根据方面的表述方式,ABSA可分为:方面词情感分析(Aspect-term Sentiment Analysis,ATSA)和方面类别情感分析(Aspect-category Sentiment Analysis,ACSA)。ABSA的传统解决方法通常为基于情感词典方法和基于特征提取的机器学习方法。基于情感词典方法的性能非常依赖于词典的质量,基于特征提取的机器学习方法需要繁重的特征工程。针对传统方法中的问题,深度学习方法可通过设计良好的模型来自动学习、提取与任务相关的特征,并突破传统方法的性能瓶颈。因此,本文主要研究基于深度学习相关模型的方面级情感分析问题,并研究模型在实际场景中的应用。本文主要的工作和成果如下:(1)提出一种基于混合神经网络的方面词情感分析模型,解决方面词情感分析中的特征提取不充分问题。该模型通过混合LSTM-Attention(Long Short Term Memory-Attention)特征提取模块和卷积神经网络特征提取模块来提取文本中的特征,从而同时利用文本的全局和局部情感语义。通过在SemEval2014Task4相关数据集上进行实验,该模型在Laptop和Restaurant领域数据集上分别达到74.7%和79.9%的准确率,优于同类型基线模型,实验结果表明了混合神经网络的有效性。(2)提出一种基于 BERT(Bidirect i onal Encoder Representation from Transformers)的改进模型和长文本截取策略,应用于AI Challenger 2018中文数据集,提升粗、细粒度方面类别情感分析的性能。该数据集中的文本为段落级别的长文本,并且一段文本包含多个细粒度方面的情感倾向,为多标签分类任务。本文首先在BERT模型的微调结构上增加了额外的注意力层,将BERT模型的输出编码层中的所有特征进一步抽取和利用;然后使用BERT模型中的句子对(sentence-pair)输入方式来处理方面类别情感分析,将多标签分类任务转化为多类别分类任务。针对长文本冗余的问题,本文在数据预处理上提出了一种基于文本筛选网络(TFN)的文本截取策略,用于选出长文本中与细粒度方面相关的评论句,从而降低长文本的冗余性和噪声的干扰。对比实验结果表明了 TFN的重要性和BERT改进模型的优越性。(3)利用BERT改进模型设计了面向线上餐饮评论情感分析的Web应用。该应用能够获取线上商户的餐饮评论,并在后端利用BERT改进模型进行实时细粒度情感分析,最后将结果进行处理并生成报表展示在前端界面中。

其他文献

腰椎神经肌肉关节促通疗法对提高年轻业余棒球运动员的投球速度有明显效果

[目的]本研究的目的是调查年轻的业余棒球选手在进行腰椎神经肌肉关节促通(NJF)后,投球速度、功能性前伸测试(FR)和简单反应时间(SRT)的变化。[方法]受试者为11名年轻的业余

会议

神经肌肉关节促进疗法棒球的投球速度功能性前伸测试

基于国产实时操作系统的EPICS应用研究

随着我国自动化水平的发展,国内控制厂商基于外国操作系统,并结合近年来快速发展的现场总线技术,开发国产分布式控制系统,在火电、污水处理和核电站能够实现控制系统的国产化

学位

国产实时操作系统SylixOSEPICSEtherCAT控制系统

面向视频弹幕的文本情感分析研究

随着短视频行业的崛起,视频弹幕俨然成为播放器的特色,而网络视频、电商直播等都成为了弹幕的传播载体。用户在观看视频的同时可以通过弹幕发表对视频当前情节的评论,从而与

学位

视频弹幕文本文本情感分类情感符号空间注意力机制可视化分析

改革开放以来我国民族理论创新发展成果具有重要意义

习近平总书记指出：“时代是思想之母，实践是理论之源。”无论从现实角度看还是从历史角度看，无论从中国视野看还是从世界视野看，改革开放40年来马克思主义民族理论中国化深入发展

报纸

胃肠外科手术后应用生长激素29例

生长激素是垂体分泌的一种191个氨基酸残基组成的促生长蛋白质激素，先天性缺乏时可引起儿童侏儒症，早期主要用于治疗儿童生长激素缺乏性侏儒症的替代治疗。因其具有促进蛋白质

期刊

生长激素胃肠外科氮平衡纤维连接蛋白

双氧水生产装置应用变频调速的节能改造技术

本文简述了在双氧水生产装置上应用变频调速技术对物料输送系统改造,实现有效节省能耗,降低生产成本,提高生产效率.

期刊

双氧水生产装置应用变频调速节能技术改造Hydrogen Peroxide Frequency Conversion Energy consump

基于混合神经网络和BERT的文本方面级情感分析研究

其他学术论文