论文部分内容阅读
近年来,随着微博的快速发展,面向微博的情感分析吸引了越来越多研究者的关注。广大的网民会在微博上表达自己对社会热点事件的观点、电影的观感、产品的使用感受等。对微博进行情感倾向性分析,可以帮助政府或公司了解网民对舆论热点的态度,为公司和政府提供决策支持。 目前为止,大部分微博情感分析研究都只关注于如何对文本信息进行分析,但是微博用户情感表达方式正逐渐转变,从以往的文本为主到现在的图文结合,基于文本信息的情感分析方法已经不足以很好的获取微博消息的情感极性。因此在文本信息的基础上加入图像信息来对微博情感进行分析,变得尤为迫切和重要。本文主要研究微博环境下图像情感语义特征表示以及文本与图像相融合的跨媒体情感分类问题,主要内容和创新点如下: 1.针对现有基于SentiBank的图像情感特征ANP的检测噪声问题、区分度问题和情感话题相关性问题,本文提出了基于话题相关性模型的图像情感语义特征表示。话题相关性模型充分利用微博中同一话题下图像间的相关性和不同话题下图像间的差异性信息,对原始SentiBank特征进行选择和优化,一定程度上解决了ANP特征的检测噪声问题和ANP区分度问题,最终实验验证了基于话题相关性模型的图像情感特征表示的有效性。该图像情感语义特征的有效性使结合文本和图像的跨媒体微博情感倾向性分析成为可能。 2.针对微博中短文本信息不足和用户表达方式转变的问题,本文提出了基于文本和图像信息融合的情感倾向性分类模型。该模型在文本词袋特征和图像情感语义特征表示的基础上,采用了特征层融合和决策层融合两种方法对文本特征和图像特征进行结合。通过图像和文本两部分信息的融合解决微博中表达方式从单文本到图文结合的转变问题,同时图像信息在一定程度上弥补了文本信息的不足。实验表明本文提出的融合模型在微博情感倾向性分类任务中,相比传统的单文本模型,分类准确率有所提升。本文进一步对比了文本和图像的特征层融合和决策层融合两种方法,实验表明目前采用决策层融合方法可以获得更高的准确率。