论文部分内容阅读
随着互联网在全球范围内的飞速发展,互联网已成为反映社会舆情的主要载体之一。在这种环境下,BBS论坛也已进化成网络舆论的策源地和集散地,BBS在国内高校也已是大学生最常使用的信息交换平台之一。对于社会上、校园内的消息或发生的事件,参与者利用BBS进行消息传递,并通过回帖的形式予以呼应或发表不同看法。从管理者的角度,应及时地了解学生关注的话题,对其中的敏感话题做出适当的处理和回应,以避免事件日益扩大而造成团体组织或个人的名誉或权益的伤害。然而,BBS上的信息是海量的,管理者无法时刻查看其中所有的主题帖,因此,一套网络舆情智能监控系统是必要的。同时,应建立相关机制,利用科学技术手段对高校BBS网络舆情进行监控,协助管理人员,提高效率和准确性。本研究在分析国内外网络舆情智能监控的发展和现状的基础上,从网络舆情智能分析系统中关键技术——模式识别入手。依据逸仙时空BBS过去6个月的主题帖及其回帖的统计与分析,归纳了异常主题帖的特征,并提取回帖量、参与讨论ID数和回帖时间间隔三个变量来衡量主题帖的受关注程度。同时,根据统计分析发现,三个变量在一定的时间周期内呈正态分布。再分别以天和小时作为时间周期,依据数理统计的相关原理,设定筛选异常主题帖的预警值,发现属于异常范围的主题帖则告警。本研究共设定了7个规则算法,分别以每天或每小时的发帖量、参与讨论ID数,和时间间隔以及发帖量与参与讨论ID数组合制定筛选和预警规则。为了验证其科学性和实用性,针对规则一至五,对BBS以往六个月的数据进行筛选,利用数据库sql语言和办公软件excel进行人工统计,并发现异常,结果较明显,平均准确率达75%。在总结各规则间的关系及优劣另外发现,各算法之间存在一定重合却不能完全替代,因此,提出可将其中两个算法进行组合从而提高准确率和全面性。