论文部分内容阅读
在社交网络中,信息传播指以社交网络为媒介进行的观点、谣言、评论、用户行为等多种形式信息的传播过程。社交网络对当今社会的信息传播发挥越来越重要的作用,社交网络信息传播的研究具有现实意义。研究观点演化与谣言传播可以深入理解信息传播的内在规律,及时地发现和监控网络舆情,预测突发事件;研究微博信息传播可以分析用户的群体行为以及爱好,预测用户行为趋势;通过对微博网络信息传播的研究,有助于分析不同类型用户的行为特征和兴趣爱好,从而更加精准地投放广告。因此,针对社交网络的信息传播研究越来越受到研究学者的重视。本文结合复杂网络理论、传播动力学、社会心理学和机器学习等学科的思想和方法,对社交网络的观点传播与演化、谣言传播、微博网络传播覆盖范围和传播深度预测等问题进行了研究。论文的主要工作和创新点如下:针对观点和网络的共同演化问题,提出了一种动态自适应网络的有界信任舆论演化模型。模型中观点的演化受网络的影响,观点的演化也会导致网络的动态变化。提出了平均观点集合数、观点统一概率、最大集合人数比例和平均步数四个统计指标,分析动态网络中观点演化的内在规律。实验结果表明,在动态自适应网络模型中,重连概率对观点演化有较大的影响。当重连概率为零时,静态网络模型的统计指标优于动态网络模型;当重连概率增加时,动态网络模型的统计指标逐渐优于静态网络模型,提出的观点传播模型更符合社会实际情况。考虑社会心理学对谣言传播的影响,提出了考虑遗忘机制的谣言传播模型,通过仿真实验研究模型中谣言传播者和免疫者的影响因素。实验发现初始遗忘概率和遗忘速度对谣言的传播力影响显著,初始遗忘概率越大,或者遗忘速度越快,谣言的传播力越弱。遗忘率为指数函数的谣言传播模型更符合社会的实际情况,实验结果有助于加深理解谣言的传播规律。根据仿真实验的结论,提出了谣言控制策略,为谣言的防控及预测提供参考。在微博转发预测研究领域中,多数都是以预测某条微博会不会被转发、预测转发概率为切入点,而很少对转发行为进行定量预测。针对这个问题,提出了改进的随机森林算法,对微博的传播覆盖范围进行定量预测。将提取的特征分为用户特征、微博特征、社交特征三大类,使用机器学习的多种算法和改进的随机森林算法训练模型。实验结果表明,使用不同的数据测试改进的随机森林模型时,预测准确率上下波动不大,具有较高的精度和良好的泛化能力。提出了改进的随机森林算法定量预测微博传播的深度。将提取的特征分为用户特征、微博特征、社交特征,使用机器学习的多种算法和改进的随机森林算法训练模型。分析不同算法的预测精度,并且研究不同的特征对预测结果的影响。实验结果表明,社交特征对传播深度的预测精度影响更大,并且改进的随机森林算法预测精度有明显的提升,具有较高的参考价值。