面向社交网络特定话题的情感词典自构建方法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:guansea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析在当前社交网络大数据分析研究中是一个热门方向,当前社交网络情感分析可分为两个研究方向,一是基于情感词典的情感分析,二是无词典的情感分析。基于情感词典的情感分析通过不断优化情感词典可有效地高情感分析的准确率,而无词典的情感分析往往准确率较低且分析成本高。在基于情感词典的情感分析领域,情感词典是情感分析的基石,因此,如何构建高效的情感词典是一个情感分析的重要研究方向。传统情感分析使用的是通用情感词典,权威的通用情感词典如台大的NTUSD,知网的HowNet情感词典,这类词典的情感分类较为单一,仅仅分出了积极、消极两类或积极、消极、中性三类,这种分类方式在当前社交网络多变的话题和人类复杂的情感维度下,无法充分满足情感分析的需要。此外,社交网络不同话题下情感词存在“一词多义”问题,这也为通用情感词典在情感分析中的运用带来挑战。针对传统情感词典的部分问题,本文出一种基于谱聚类的特定话题下情感词典自构建模型SDSC(construct Sentiment Dictionary based on Spectral Clustering),该模型从构建词典的数据集来源入手,解决不同话题下的“一词多义”问题。SDSC模型中包含热门文本筛选模型FT模型(Filter Text model)、情感关系无向图构建模型CRM模型(Construct sentiment Relationship graph model)、谱聚类分类模型(Spectral Clustering model)以及相关计算方法和理论述。对此,论文主要工作如下:1)出了热门文本筛选FT模型。FT模型根据每条评论的转发量、点赞量、评论数以及单位时间内这些互动行为的增量,筛选出有用评论作为情感词典构建的数据集。2)出了情感关系无向图构建CRM模型。CRM模型将情感词之间的情感相似度作为边的权值,情感词作为节点构建特定话题的情感关系无向图,情感词之间的情感相似度包括基础情感相似度、话题情感相似度和同义词情感相似度。3)出了谱聚类分类SC模型。SC模型采用谱聚类算法将情感关系无向图分为三个子图和五个子图,并通过中心词探测的相关计算方法识别每个子图的中心词,最终输出情感词典。4)综合上述三种模型,出基于谱聚类的特定话题下情感词典自构建模型SDSC模型。5)仿真实验证明,SDSC模型构建的情感词典有较高的准确率,同时该模型简单、灵活、高效,能较好的构建领域性情感词典,解决领域相关情感词的问题,高情感分析的准确率。
其他文献
目的探讨孕妇产前抑郁水平与社会支持的相关性,提出社区护理干预对策。方法采用抑郁自评量表和社会支持评定量表对623例孕妇进行测评,并对结果进行二元和多元逐步回归分析。
党委(党组)理论学习中心组学习制度,是伴随着中国共产党历史发展而形成的党的理论学习的重要制度,是各级党委(党组)领导班子和领导干部在职理论学习的重要组织形式,对于提高领导干部
报纸
目的总结我组游离股前外侧皮瓣手术,探讨验证更加合理的术中处理方式。方法搜集整理我组在2013年10月-2014年6月期间所完成的37例游离股前外侧皮瓣手术,对成活情况、探查因素与
全球气候变暖导致森林火险天气增加,森林火灾的发生机率有上升的趋势,因此,森林流域的防灾减灾与灾后重建问题的研究值得重视。森林火灾通过影响植被、地表枯落物、土壤及生态环
目的观察强化延续护理对急性冠脉综合征患者二级预防的影响。方法将108例急性冠脉综合征患者按居住地不同分为观察组和对照组,观察组出院后予强化延续护理,对照组予常规随访,
以往的研究发现,双语者言语产生的词汇通达过程中,非目标语言的词汇也得到了激活。但是非目标语言的词汇激活到了什么层面,非目标语言的词汇是只是在词条选择层面得到了激活
二战期间,战争再次为女性进入公共领域提供了契机,大量英国女性涌入就业大军成为承载这一时期社会生产的重要力量。本文通过详细探究二战期间英国女性就业问题,思考就业为英
文章通过分析基层卫生计生监督执法实际存在的执法队伍建设、执法方式、体制建设等问题,提出充实执法队伍,提高人员素质,推动体制完善,争取政府支持等解决对策,旨在促进基层卫生计
目的:通过利用可活化穿膜肽的特性将荧光标记物及磁共振对比剂带入人肝内胆管上皮细胞,借此研究肝内胆管上皮细胞在胆管病中的变化,探讨在肝胆管病中体外监测胆管上皮细胞变
近年来,公安体制在改革中呈现出明显的变化,但由于人和物的种种条件限制,公安体制还存在许多不合理的现象。从基层的角度对现行公安体制提出质疑,有助于公安体制的进一步深化