基于热量模型的微博舆情实时监控系统研究

来源 :济南大学 | 被引量 : 0次 | 上传用户:wj781228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的不断进步,导致人们的交流方式随之发生改变,大量的网络社交平台应运而生,其中,微博毫无疑问占据重要地位。微博,以它的及时、自主和极强的互动性等特点,区别于传统媒体,在新时代的互联网大潮中得到了迅速的发展。目前,微博已经成为大众化的互联网舆论平台,是互联网用户发布分享信息的重要途经。而正是因为微博极强的互动性、自主性和快速性,导致其舆情事件的爆发往往类似于传染病毒的扩散爆发,这给舆情的监控带来了巨大的挑战。本文面向微博舆情的实时监控问题,主要针对情感分析和用户影响力分析两大问题开展研究。首先针对情感分类问题,本文提出了基于集成学习的情感分类算法。该算法首先利用微博爬虫爬取目标相关微博信息,获得原始数据。然后对原始数据进行分词,去除停用词等预处理,再利用TF-IDF方法提取特征向量,并使用SVD方法对特征向量进行降维,最后使用Stacking集成策略集合五个基础分类器构成情感分类模型对数据进行情感分类判别。之后针对用户影响力分析问题,提出了基于Page Rank和HITS的影响力分析算法,在该算法中,首先利用微博爬虫爬取目标微博用户关系网络,分别用Page Rank算法和HITS算法对复杂网络进行计算,计算其中的节点影响力,得到的PageRank,Hub和Authority值组成特征向量,再利用RankSVM算法对节点进行影响力排序,得到最终的用户影响力大小。然后结合情感分析和用户影响力分析,借用热量模型的概念,提出了基于热量模型的舆情分析方法,并通过多种实验对比,证明舆情分析方法的有效性和及时性。在文章的最后对本文的工作进行了总结,并对下一步的工作进行了展望。
其他文献
消费作为拉动国民经济增长的三驾马车之一,近年来成为我国经济转型升级的主要动力。电子商务的快速发展有效释放了消费潜力,网络消费市场规模的不断扩大也大大刺激了用户对互
GK-1井位于江陵凹陷沈市断裂带南岗一号断鼻构造,完钻井深3581m,固井目的层位为含钾石岩、石膏以及芒硝的粉质泥岩地层。使用常规盐水水泥浆固井其与地层的胶结质量差,制约着固
本文论述了知识经济的含义、特征和作用,阐述了它对图书馆产生的影响,提出了现代图书馆为适应知识经济时代的到来应着重加强建设的几个方面.
淮南某电厂灰坝设计拟采用粉煤灰作为坝基排水垫层筑坝以节约资金.为研究其可行性,在已有的大量静力和动力特性试验研究基础上,对该灰坝在地震荷载作用下的动力反应进行研究.
为了研究型钢混凝土组合结构的抗震性能,对地震恢复力模型进行了研究。通过比较国内外学者已提出的恢复力模型,分析了其优势与不足,得出刚度退化三折线恢复力模型适用于型钢混凝
多级水蒸汽喷射泵多为大型设备工艺过程中提供需要的真空环境,是冶金、石化、制药、食品等行业的重要基础设备,泵的抽气性能及稳定性关系到工艺流程的进行和最终产品的质量。
当前,被监管人死亡事件受到社会高度关注,处理不好就会影响社会稳定。当前,在处置被监管人死亡事件中存在法律制度不健全、程序不公开、处理标准不统一、当事人权利保障不足
<正>2009年3月,据中国CDC慢性病中心综合防治室统计,心脑血管病是目前我国发病率、致残率和死亡率最高的疾病,每年我国有300万人死于心脑血管疾病,占全部死亡原因的40%左右,