论文部分内容阅读
Web 2.0时代最显著的特点就是以用户为中心,更加注重用户的交互作用,微博就是Web 2.0时代以来出现的代表技术之一,其简单的发布流程和随意的表达方式,让用户能自由地参与网络世界的互动。因为个人价值观的不同,不同的用户会有不同的行为,对群体中其他用户的影响力也不同。微博用户影响力指微博用户在微博关系网络中对其他用户的影响能力。用户作为微博平台的核心组成部分,研究其在关系网中的影响力,有利于微博的发展,为其进一步扩展提供基础,能给不同的商业应用提供新的机会。微博关系网络是社会网络的一种,符合复杂网络的小世界现象这个基本特征。一般说来,同一个小微博关系网络中的用户之间连接比较紧密,与其他小微博关系网络的链接很稀疏。我们称以普通用户为主,用户链接没有明显的特点的小微博关系网络为姊网态微博关系网络。研宄蛛网态微博关系网络中的用户影响力的评估,不仅有利于进一步研究微博用户行为,而且有助于对微博关系网络的研宄。本文认真整理与分析现有的对微博用户影响力的研究情况,总结它们存在的不足之处,提出一种基于用户综合质量的蛛网态微博关系网络中用户影响力评估模型。我们首先研宄了微博用户质量,从微博用户特征研宄入手,分析用户的主动行为特征与被动行为特征对用户影响力的影响,根据选择的七个用户行为特征提出三个影响因素(用户活跃度、覆盖度及博文质量)来表示用户自身质量,提出用户综合质量的概念及计算方法。然后参照著名网页链接算法PageRank算法的算法思想,结合用户综合质量,提出一种蛛网态微博关系网络中用户影响力的评估方法。本文用到的实验数据集来自使用爬萌中国提供的用户数据釆集器采集的新浪微博真实用户数据。首先,按模型流程,严格对原始数据集进行预处理,比如去掉僵尸用户或沉默用户,在一定程度上保证了实验结果的质量。然后,从不同角度对数据集进行可视化分析,帮助理解用户特征对影响力的影响。最后,针对本文评估模型的实验结果与粉丝数评估方法、中心性分析方法以及传统的PageRank算法进行结果对比与分析,从理论与实践的角度说明本文所提评估模型的合理性与有效性。