面向微博的跨媒体情感分类技术研究

来源 :厦门大学 厦门大学 | 被引量 : 0次 | 上传用户:siaonn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着微博的快速发展,面向微博的情感分析吸引了越来越多研究者的关注。广大的网民会在微博上表达自己对社会热点事件的观点、电影的观感、产品的使用感受等。对微博进行情感倾向性分析,可以帮助政府或公司了解网民对舆论热点的态度,为公司和政府提供决策支持。  目前为止,大部分微博情感分析研究都只关注于如何对文本信息进行分析,但是微博用户情感表达方式正逐渐转变,从以往的文本为主到现在的图文结合,基于文本信息的情感分析方法已经不足以很好的获取微博消息的情感极性。因此在文本信息的基础上加入图像信息来对微博情感进行分析,变得尤为迫切和重要。本文主要研究微博环境下图像情感语义特征表示以及文本与图像相融合的跨媒体情感分类问题,主要内容和创新点如下:  1.针对现有基于SentiBank的图像情感特征ANP的检测噪声问题、区分度问题和情感话题相关性问题,本文提出了基于话题相关性模型的图像情感语义特征表示。话题相关性模型充分利用微博中同一话题下图像间的相关性和不同话题下图像间的差异性信息,对原始SentiBank特征进行选择和优化,一定程度上解决了ANP特征的检测噪声问题和ANP区分度问题,最终实验验证了基于话题相关性模型的图像情感特征表示的有效性。该图像情感语义特征的有效性使结合文本和图像的跨媒体微博情感倾向性分析成为可能。  2.针对微博中短文本信息不足和用户表达方式转变的问题,本文提出了基于文本和图像信息融合的情感倾向性分类模型。该模型在文本词袋特征和图像情感语义特征表示的基础上,采用了特征层融合和决策层融合两种方法对文本特征和图像特征进行结合。通过图像和文本两部分信息的融合解决微博中表达方式从单文本到图文结合的转变问题,同时图像信息在一定程度上弥补了文本信息的不足。实验表明本文提出的融合模型在微博情感倾向性分类任务中,相比传统的单文本模型,分类准确率有所提升。本文进一步对比了文本和图像的特征层融合和决策层融合两种方法,实验表明目前采用决策层融合方法可以获得更高的准确率。
其他文献
Internet快速地发展,见证了网络信息正在以前所未有的速率增长,其中很大一部分信息被“深藏”于各种各样的网络在线数据库中,用户只能通过向接口提交查询来获取信息,这类信息
本论文主要内容是电子政务系统中工作流机制的研究与实现。为了在电子政务系统中支持工作流机制,满足项目需求而实现一个轻量级的工作流引擎。 本文首先介绍了工作流管理系
作为物联网的一个重要分支,无线传感器网络 WSN的作用是在所监测环境中感知、采集数据,相邻节点实时地感知同一对象信息,然后将其融合、压缩后通过无线自组多跳路由协议发送给基
数字图像压缩一直是信息处理技术研究的热点,尤其是信息化社会使得“数字化”的概念深入人心,在享受计算机、网络和数码产品带来的多彩视觉大餐的同时,也引入了海量的视觉信息急
学位
可拓学是一门最近发展起来的原创性学科,它以形式化的模型,探讨事物拓展的可能性以及开拓创新的规律与方法。将可拓学应用到不确定性推理中是一个崭新的课题。本文将可拓学中
随着计算机网络技术和信息技术的快速发展,无论是政府、企业还是个人都逐渐依赖计算机存储信息,并借助网络传递、交换重要资料。这些信息在进行处理和传递前要以电子文档的形式
当今社会,虽然信息的获取方式多种多样,但是图书作为古老而又庞大的信息载体,仍占有主要的地位。那么如何有效地管理这些信息资源成为人们广泛关注的问题。图书馆管理系统是
随着空间数据在信息技术领域应用中的需求量不断增加,地理信息系统(Geographic Information System,GIS)在资源调查、评价、管理和监测,在城市的管理、规划和市政工程、行政管理
访问控制是信息安全的重要课题之一。在企业级开发中,最为普遍采用的访问控制机制是基于角色的访问控制(Role Based Access Control),简称RBAC。标准的RBAC包括核心RBAC、继承
网络考试系统的研究与开发一直是近些年来国内外教育教学改革的一个重要方面。考试系统不仅是标准化考试的方向,更是顺应时代的潮流,将考试、统计、比较、交流等推向全球,更有利