论文部分内容阅读
网络舆情是网民通过互联网提供的各种媒体,所表达的对某一事件的认知、情感、态度和行为倾向性的总和。随着互联网在生活中的应用范围不断扩大,网络舆情在社会中的影响力也越来越大。由于互联网具有虚拟性、随意性、渗透性和发散性等特点,消极负面的舆情信息能迅速扩散并可能对人们的日常生活产生不良影响,甚至可能引发舆情危机,严重危害社会公共安全。预测网络舆情未来的发展趋势,能够发现潜在的舆情危机,对维护社会稳定和促进国家发展具有重要的现实意义。因此,研究网络舆情的预测技术,具有重大的现实意义。实现对网络舆情发展趋势的预测,首先要从互联网上获取能表征网络舆情发展规律的数据。本文使用网络爬虫获取网页,根据从网页中获取得到的信息,通过聚类和热度计算找出热点议题,然后基于热点议题按时间统计回复总数,并用它组成的时间序列来表征网络舆情。获得数据后,要实现对网络舆情预测的研究,需要建立合理的预测模型。目前,有些学者基于传统的数学方法建模,还有些研究者采用人工神经网络模型。表征网络舆情的时间序列是非线性动态变化的时间序列,因此,本文选用标准Elman神经网络模型对网络舆情的未来发展趋势进行预测。标准的Elman神经网络模型只存储了隐藏层各节点的历史信息,鉴于模型的网络结构中各层的历史信息都会影响整个模型的数据处理能力,本文提出对标准的Elman神经网络模型的网络结构进行改进,通过增加反馈节点来存储各层神经元的历史信息。在Elman神经网络模型的网络参数的训练算法上,采用具有全局搜索策略的遗传算法,克服传统梯度下降训练算法易陷入局部最优解的缺点。本文采用遗传算法训练改进后的Elman模型的网络参数,构建最新的GA-Elman预测模型来对网络舆情的发展趋势进行预测。本文采用均方误差和平均相对误差作为评价模型预测性能的指标。本文设计了两组实验,第一组实验用来证明标准Elman神经网络模型的预测性能优于BP神经网络模型和ARIMA动态模型。第二组验证了通过两方面综合改进获得的GA-Elman预测模型的预测性能是几个模型中最好的,表明这种综合改进方案是有效的。