论文部分内容阅读
电子商务作为当下的一种新的购物和营销渠道,导致了互联网中各种服务和产品的评论数量激增。在这种情况下,属性级情感分析(Aspect Based Sentiment Analysis,ABSA)——即从文本中提取和总结有关特定实体及其属性的情感倾向,可以帮助消费者选择企业和产品,同时也可以帮助企业更好地监控其服务和产品的质量并快速了解市场需求。属性级情感分析旨在识别文本中提到的所有属性类别及其对应的情感极性,即属性类别检测子任务(Aspect-category Detection)和情感分类子任务(Sentiment Classification)。当前存在的绝大多数方法都分别对这两个子任务建立模型,尽管在两个子任务上目前都取得了优秀的实验结果,然而其提取的都是不完全的用户观点,并且上游的属性类别检测任务的准确性也会影响到下游的情感分类任务的效果,实用价值大大降低。此外,属性级情感分析任务需要的数据标注十分昂贵,导致可用数据极其稀少,也为属性级情感分析任务带来许多挑战。基于以上问题,本文提出了多种端到端的属性级情感分析模型,并通过引入预训练产生的词向量缓解数据稀少的问题。本文的研究内容归为以下三点:针对句子级别的属性级情感分析任务,本文提出了三种端到端的属性级情感分析模型:端到端的双向长短记忆模型(Bi-directional Long Short-Term Memory,Bi-LSTM)、端到端的注意力机制模型和基于注意力机制的双向LSTM模型。针对评论级别的属性级情感分析任务,本章提出了基于LSTM和注意力机制的分层模型。实验结果表明,在评论级别的属性级情感分析任务中,本文提出的分层模型可以得到比单层模型更优的结果。并且在Sem Eval-2016餐厅评论数据集上,基于LSTM和注意力机制的分层模型获得了迄今为止最优的结果。针对属性级情感分析任务可使用的训练数据过少的问题,本文引入预训练产生的词向量来提升模型效果。实验结果表明,在训练数据极其缺少的属性级情感分析任务中,选择合适的词向量表示方法是极其重要的,其可以引入恰当的外部信息,缓解训练数据缺少的问题,大幅度提升模型的效果。