论文部分内容阅读
在网络信息开放的自媒体时代,人人都能自由的以信息化的方式来发表观点、表达意见、宣泄情绪,而互联网又存在受众面广、传播速度快、超越时空性等特点和各大媒体平台对编辑的文字字数、视频时长等的限制,以致相关信息转达准确性不高,从而更加容易将网络舆情信息演变成网络舆情危机信息。与传统舆情危机相比,由网络舆情演变的舆情危机爆发概率高、持续时间短,且影响的范围更大,政府管控难度升级,对网络舆情危机预警进行研究也就存在其必要性和紧迫性。而进行网络舆情预警最有效的办法就是在网络舆情危机信息萌芽初期就能够及时地对其进行识别,然后采取相应措施实施管控。本论文在大数据背景下,对国内外网络舆情预警的研究现状和发展趋势进行分析,运用文献分析法、比较分析法和现今热门的数据挖掘算法等方法,从多层面、多角度对网络舆情危机预警的指标体系、分级准则、分析方法进行研究,旨在构建智能的一体化网络舆情预警自动识别体系。针对现有网络舆情分级和预警研究的不足,本文从多个方面探讨网络舆情自身特点与演化规律,在遵循可行性、全面性、科学性以及定量为主、定性为辅原则的基础上,首先构建了一个包括三个层次、四大类、13个二级指标的网络舆情预警指标体系;接着以数据为驱动,采用灰色关联分析法和聚类算法实现舆情事件分级过程,其中灰色关联分析法中引入了熵权法的思想,用来确定舆情事件的热度综合评价指标,而聚类算法则用来确定舆情事件的分级阈值,最终将舆情事件分为轻微级、警示级和严重级三个类别;然后应用随机森林-序列后向选择算法提取预警模型构建中影响重要的舆情预警特征指标,并运用改进的堆叠组合算法构建网络舆情预警识别模型;最后利用网络舆情案例库数据验证模型,通过与其他模型进行比较,证明了改进的堆叠组合模型的合理性、可用性和有效性。