论文部分内容阅读
文本细粒度情感分析作为自然语言处理领域中的一项重要任务,其研究目的在于从互联网中有价值的评论文本信息中挖掘诸如产品、服务、事件等细粒度元素,并对相关细粒度元素进行情感判别。目前细粒度情感分析已经广泛应用于社交网络、电商服务、舆情分析等方面,从中展现了它巨大的价值。近年来,深度学习的不断发展,为细粒度情感分析提供了 一系列的解决方案,虽然这些方案取得了不错的效果,但是在计算复杂性以及模型大小上都大大增加,使得情感分析的效率变低。特别是在如今具有海量评论数据的网络中,低效率的细粒度情感分析方案意味着时间成本急剧上升。鉴于门控卷积网络具有较高计算效率的特性,本文针对当前主流的方法存在的效率问题,提出基于门控卷积网络的改进细粒度情感分析算法。本文的主要工作如下:(1)研究如何提取评论文本中细粒度元素;由于循环神经网络、条件随机场此类主流方法存在计算效率偏低以及文本整体联系提取能力不强的问题,本文提出基于门控卷积网络的文本细粒度元素提取模型。另外,在细粒度元素抽取过程中经常会出现边界定位出错的问题,本文尝试通过指针网络进行span区间定位的方式解决该问题。(2)优化文本特征表示方法;目前文本特征表示方法是采用concat特征向量的方式直接进行相关语义的融合,但特征向量映射到特征空间并不统一,导致引入一些杂质信息。本文针对此问题,从情感词典、句法结构特征、位置编码等不同角度文本特征表示出发,采用多通道文本表示向量融合的方式抽取文本中所蕴含的语义信息。(3)研究如何快速对文本中提取的细粒度元素进行情感分析;当前大多数解决方案是基于预训练BERT模型或者递归神经网络,但这些方案计算复杂性高,效率低,使其无法进行快速地结果响应。于是本文结合研究工作2中的文本特征表示方法,提出门控交互膨胀卷积网络的细粒度情感分析模型,在保证准确率的同时,明显降低整个模型的在训练过程中的时间复杂度以及模型大小尺寸。为验证设计模型效果,本文采用公开的短文本评论数据SemEva12014作为数据集,设计不同的对比、消融实验,选择合适评价指标,用于判定最终的实验效果。结果表明,与主流使用的BERT预训练或者RNN网络的方式相比,本文模型在准确率、召回率上保持一定的竞争力,并且模型尺寸大小以及训练时间复杂度上优化明显。