论文部分内容阅读
突发事故一旦发生,如何快速检测网络舆情非常重要。由于我国微博用户数量的快速增长和微博在信息传播速度、广度和便捷性上的优势,微博在聚合网络舆论方面发挥了巨大的作用,发展成长为中国最重要的网络舆论场。因此,在微博平台进行突发事件的舆情监测具有十分重要的意义。 目前对突发事件的舆情监测往往存在话题粒度太粗、地理舆情不够精确、舆情可视化角度单一等缺点。为克服这些缺点,本文主要进行了以下几项工作: (1)在获取微博舆情数据方面,给出了一种高密度的微博数据采集方法。当突发事件发生后,根据用户指定的突发事件的关键词,以微博开放平台的搜索接口为入口,进行高密度的数据采集工作,获得结构化的突发事件舆情微博信息,即除了微博的文本内容之外还包括微博的相关属性信息,比如发表时间、作者信息、发布微博的地理位置等。为后续多角度的展示微博舆情提供基础数据。 (2)在微博舆情数据的分析方面,构建了带权值的微博主题词共现网络,基于该网络提出了突发事件中隐含的热点子话题挖掘方法,使突发事件话题更加细化,从而提高舆情监测的话题精度。同时,使用舆情微博中的地理名词进行聚类的方法来挖掘突发事件在指定地点的具体话题,从而分析出突发事件在具体地点的详细舆情信息,提高了舆情监测的地理精度,也为相关部门处置突发事件时提供更充分的辅助决策信息。 (3)在舆情数据的可视化方面,通过挖掘舆情微博的时间属性和地理信息属性,并使用可视化展示工具将实时采集到的舆情数据直观的展示为折线图、地理分布图,不仅可以根据微博数量来判断舆情的发展动态,还可以根据微博的地理信息显示出舆情的空间分布并由此分析舆情的波及范围及程度,使舆情的发展态势一目了然,从而大大提高舆情监测的展示效果和突发事件的决策效率。 最后对“北京暴雨”、“八宝矿难”两个突发事件的舆情数据进行了4个实验,通过实验验证了本文给出的话题挖掘算法、基于地理名词的舆情监测方法以及多角度可视化舆情展示,实验证明这些方法具有良好的效果,不仅提高了舆情监测能力,也提高了相关人员的决策效率。