基于上下文观点的微博情感倾向分析研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:wuhuwuyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一种新兴的社交媒体被广泛使用,其每天的数据交流数量呈现爆炸式的增长,这些数据为自然语言处理提供了良好的语料环境。微博文本具有和短文本一样的长度较短、情感表达强烈、话题单一的特点,这就需要通过不同于长文本情感分析的方法来处理。本文通过对短文本情感分析进行改进,将上下文的观点信息加入到情感计算中,同时建立微博表情符号情感词典,最终得到情感倾向性结果。本文首先对微博评论文本的处理技术进行研究和探讨,然后融合微博表情符号情感词典自动构建方法构建微博情感词典,同时抽取出微博评论的上下文观点信息,最后对这些信息进行整合处理,得到情感倾向性分析结果。本文所做的工作主要包含以下三个方面的内容:(1)提出了基于微博表情符号的情感词典自动构建方法,并应用于微博评论情感分析微博评论文本通常具有主观情感,并且领域广泛,因此在进行情感倾向性分析之前我们要正确分析出微博评论的情感信息。情感词典的完善程度决定了情感分析准确率的高低,在考虑微博表情符号对微博文本情感倾向的影响以及情感词典构建的基础上,提出一种融合表情符号的情感词典自动构建方法。该方法首先利用COAE2015任务一中提供的训练数据集对其进行分词、去重等操作,然后获得情感词并得到其在正负向语料中的出现次数,最后再利用PMI计算其情感倾向性大小,最终生成情感词典。(2)研究上下文观点信息对情感倾向性的影响,提出一种基于上下文观点信息的情感倾向分析方法在进行情感倾向性分析之前,首先要对文本当中的上下文观点进行界定。由于用户在发表评论时或多或少的会受到原始文本以及其前面评论的影响,本文提出了基于上下文观点信息的情感倾向性分析方法,并将其应用到微博评论中的情感分析当中。该方法首先对评论文本按照评论的先后次序进行编号,按照次序的大小对评论文本进行赋值权重,最后结合建立的情感词典,获得算法最终的情感倾向。(3)设计并实现了基于上下文观点信息的微博情感倾向性分析原型系统在分析微博评论文本的情感倾向性过程中,针对每个方面设计了相对应的功能模块,并实现了基于上下文观点信息的微博情感倾向性分析原型系统。该系统可以对微博当中出现的评论文本进行挖掘抽取、分析处理,并最终向用户提供直观的情感倾向性。
其他文献
随着我国金融行业的快速发展,大量繁杂的金融数据需要快速有效的处理,而通过最小二乘法来估计参数的多元线性回归算法处理金融数据,难以得到准确的结果。根据金融数据存在多
图像分割的基本原理就是根据某种特性把图像分解成若干区域,并把感兴趣的目标对象提取出来,这些特性可以是灰度、纹理、颜色等。水平集方法在处理图像分割问题上表现出了良好
软件需求描述(如场景)中存在的细节过多、缺乏结构性、不规范、不一致等问题,为后续的软件开发活动带来困难,需求分析是解决上述问题的有效途径。过程建模是目前项目实践中使用较
在广播电视系统中,出于对传统电视兼容和传输带宽成本的考虑,电视信号在传输过程中在将来很长一段时间仍将采用隔行扫描格式。对高清晰度数字电视(HDTV)而言,它们的显示系统只支持
近年来,由于经济的快速发展和计算机科技的普遍应用,应用在户外的监控系统对图像处理技术的要求也越来越高。但是环境问题的日益突出给这些技术的应用带来了挑战,尤其是当前
随着数据收集工具的广泛应用,海量数据的收集和积累导致“数据爆炸”,已经超出了人们理解和掌握的能力,传统的数据分析方法已不能满足需求,数据挖掘和知识发现技术应运而生并得到
近年来,跟随全球信息化建设的浪潮,Web应用系统(基于浏览器和后端服务器)已经逐渐替换原有的传统信息系统(基于客户端和后端服务器)成为当令信息系统架构和构建中最流行的方式。Web
学位
随着医学领域影像数字化进程的推进,医学影像成像技术和设备不断发展,数字医学影像已日益成为现代医疗最重要的基础手段之一。每天都会有大量包含生理、病理相关信息的医学图像
人脸表情识别是计算机视觉和模式识别领域的一个研究热点,引起越来越多的国内外研究者的广泛关注。人脸表情识别的目标是让人工智能产品能够自动识别出人的表情,进而分析人的内