基于扩展词典和规则的中文微博情感分析

来源 :北京交通大学 | 被引量 : 15次 | 上传用户:shoolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来社交网络得到了快速的发展,作为社交平台的一员,微博以其即时性、互动性、便捷性的特点从一众社交平台中脱颖而出。越来越多的人通过微博获取信息、分享心情、交流观点。通过对微博文本中的信息进行情感分析,可以获悉群众意见、了解用户态度、得知产品信息,这对政府的政策颁布、企业的发展定向、商家的产品改良都有着巨大的益处。微博成为了人们日渐离不开的社交工具,而微博文本情感分析研究也受到了越来越多专家学者的重视。微博情感分析主要是判别微博文本的情感倾向,情感倾向一般分为正向、负向、中性三种类别。微博文本与传统文本在内容格式上有较大不同,在对微博进行情感分析时,需要在传统文本情感分析的基础上,加入对微博自身特点的考虑。本文对已有基础情感词典进行分析整合,并创建网络情感词典进行补充;基于微博语料文本,创建微博领域情感词典和微博表情词典,对基础情感词典进行扩展;分析文本语义规则并设置相应权值,最后结合扩展词典和语义规则对微博文本进行情感倾向性分析。本文的主要研究内容如下:(1)微博文本情感分析建立在情感词典的基础上,本文对已有基础情感词典资源进行整理和分析,根据投票规则和优先权规则创建综合基础情感词典,统计分析用户上网习惯,选取热门输入法词库中的网络情感词创建网络新词情感词典。(2)创建微博领域情感词典和微博表情词典对传统情感词典进行补充。基于微博语料,采用扩展的SO-PMI算法自动创建微博领域情感词典,并对创建过程中基准词选取方法和候选词选取方法进行改进;从微博预料中根据词频选取常用微博表情,创建微博表情词典。(3)语义规则会影响文本的情感分析效果。从词语和语句两个方面分析语义规则,词语规则主要分析否定词修饰规则和程度词修饰规则,语句规则主要分析句间规则和句型规则。此外还分析了文本末句规则以及文本表情加权规则。最后,为了验证本文提出的基于扩展词典和语义规则的方法的有效性,采用COAE2014微博测评数据进行实验,实验结果表明,相对于传统的微博情感判别方法,本文提出的改进方法提高了微博文本情感分析的准确率。
其他文献
在钢琴教学中融入情感教育是高职院校教学改革的必然要求,本文从高职钢琴教学中融入情感教育的必然性与情感教育在高职钢琴教学中的价值入手,指出使情感教育更好地融入高职钢
'这奇妙神秘的光束,是关于我们的故事.这里的声音和图像从空间传向你,带给你一片惊喜和新奇……'这是英国广播公司首次正式播出电视节目时,演员为庆祝电视诞生唱出的
.NET为ASP.NET应用程序提供了自定义凭证管理。本文拟提出解决方案架构,使基于Windows窗体的Intranet应用程序能够方便地使用ASP.NET管理基础架构,这样基于Windows窗体的Intr
日用陶瓷具有物质功能和文化功能双重属性,在市场经济条件下,日用陶瓷要加快发展,就必须赋予日用陶瓷更多的艺术与文化;要增强陶瓷的文化功能,就要引领陶艺、绘画、雕塑等艺
目的研究大孔吸附树脂吸附纯化沙棘果原花青素粗提物的工艺条件。方法以原花青素的吸附量和脱附率为考察指标筛选树脂,并研究大孔吸附树脂的吸附性能和洗脱参数。结果HPD-700
目的:探讨精神分裂症(癫证)不同中医证型与血浆同型半胱氨酸血症的关系。方法:将70例精神分裂症癫证患者按中医辨证分为痰气郁结证、气虚痰结证、心脾两虚证、阴虚火旺证四型,用
<正>2009年完成的国家重大历史题材美术创作工程,由中共中央宣传部、国家文化部和财政部三家单位组织实施,以1840年以来中国历史上反帝、反封建、反殖民主义斗争以及社会主义
除氧器排汽余热回收节能装置将除氧器等其他设备排出的高温余汽进行冷却,同时加热冷却水,使排汽余热得以充分利用,消除排汽的噪音污染和对环境的热污染。
研究了pH胁迫对日本对虾血清非特异性免疫因子及对虾肌肉RNA/DNA比值的影响。结果表明,低pH胁迫组(pH 7.2)和高pH胁迫组(pH 9.2)总一氧化氮合成酶(TNOS)活力分别在31、2 h时达到最
肖邦,波兰文明的化身,他惊人的音乐才华带给世界的远远不止那些流传至今的音乐作品,而是他对音乐的执着与热爱,对祖国的忠诚和眷恋,对生活的希望与期待。从他的钢琴作品《离别曲》