论文部分内容阅读
随着互联网的普及和电子商务的迅猛发展,情感分析已经受到来自学术界和工业界越来越多的关注。在电商平台中,面向用户评论文本的情感分析对于研究用户反馈、进行商品推荐等都具有十分重要的意义。然而,在真实的电商平台上,有大量的商家通过刷单的方式来提升店铺信誉和商品销量。这种方式不仅带来了大量的虚假评论,而且对于用户的购物体验以及平台的公平性都有着极大的负面影响。针对上述困境,各大电商平台陆续推出了一种新颖的面向用户的问答型评论方式。这种面向用户的问答型评论方式由潜在买家针对特定商品提出关心的问题,平台根据用户的信誉值随机挑选已购买此商品的高质量用户回答相应问题。相比于传统的评论方式,这种问答型评论方式描述更具体,也更可信,并且在很大程度上能够避免虚假信息的产生。本文主要针对这一新颖的问答型评论进行情感分析相关研究,具体研究内容分为以下三个方面:首先,针对问答型评论中问题文本和答案文本均包含情感信息的特点,本文提出了一种基于双向注意力机制的问答情感分类方法。该方法可以很好地捕捉问题文本和答案文本之间交互的情感信息。具体而言,首先,采用双向长短时记忆网络对问题文本和答案文本分别进行编码;其次,通过双向注意力机制同时计算问题文本和答案文本中词语的情感权重;最后,通过情感权重计算得到问答型评论的情感信息。实验结果表明本文提出的基于双向注意力机制的问答情感分类方法性能明显优于其他基线方法。其次,针对问答型评论中的冲突情感类别难以预测以及信息冗余问题,本文提出了一种基于层次匹配网络的问答情感分类方法。具体而言,首先,对问题文本和答案文本进行句子切分,并构建一系列的<句子,句子>二元组,每个<句子,句子>二元组中包含一条来自问题文本的句子和一条来自答案文本的句子;其次,通过问答双向匹配机制挖掘每个<句子,句子>二元组的情感匹配信息;最后,通过自匹配机制计算每个<句子,句子>二元组的情感权重并得到问答型评论最终的情感表示向量。实验结果表明本文提出的基于层次匹配网络的问答情感分类方法性能明显强于其他基线方法。最后,针对问答型评论已标注数据匮乏的问题,本文提出了一种基于联合学习的问答情感分类方法。该方法通过大量易获得的普通评论辅助问答情感分类任务,将问答情感分类作为主任务,将普通评论情感分类作为辅助任务。具体而言,首先,通过主任务模型单独学习问答型评论的情感信息;其次,使用问答型评论和普通评论共同训练辅助任务模型,以获取问答型评论的辅助情感信息;最后,通过联合学习同时学习和更新主任务模型和辅助任务模型的参数。实验结果表明本文提出的基于联合学习的问答情感分类方法能够较好地融合问答型评论和普通评论的情感信息,大幅提升问答情感分类任务的性能。