蛛网态微博关系网络中用户影响力评估研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:jiahongtao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web 2.0时代最显著的特点就是以用户为中心,更加注重用户的交互作用,微博就是Web 2.0时代以来出现的代表技术之一,其简单的发布流程和随意的表达方式,让用户能自由地参与网络世界的互动。因为个人价值观的不同,不同的用户会有不同的行为,对群体中其他用户的影响力也不同。微博用户影响力指微博用户在微博关系网络中对其他用户的影响能力。用户作为微博平台的核心组成部分,研究其在关系网中的影响力,有利于微博的发展,为其进一步扩展提供基础,能给不同的商业应用提供新的机会。微博关系网络是社会网络的一种,符合复杂网络的小世界现象这个基本特征。一般说来,同一个小微博关系网络中的用户之间连接比较紧密,与其他小微博关系网络的链接很稀疏。我们称以普通用户为主,用户链接没有明显的特点的小微博关系网络为姊网态微博关系网络。研宄蛛网态微博关系网络中的用户影响力的评估,不仅有利于进一步研究微博用户行为,而且有助于对微博关系网络的研宄。本文认真整理与分析现有的对微博用户影响力的研究情况,总结它们存在的不足之处,提出一种基于用户综合质量的蛛网态微博关系网络中用户影响力评估模型。我们首先研宄了微博用户质量,从微博用户特征研宄入手,分析用户的主动行为特征与被动行为特征对用户影响力的影响,根据选择的七个用户行为特征提出三个影响因素(用户活跃度、覆盖度及博文质量)来表示用户自身质量,提出用户综合质量的概念及计算方法。然后参照著名网页链接算法PageRank算法的算法思想,结合用户综合质量,提出一种蛛网态微博关系网络中用户影响力的评估方法。本文用到的实验数据集来自使用爬萌中国提供的用户数据釆集器采集的新浪微博真实用户数据。首先,按模型流程,严格对原始数据集进行预处理,比如去掉僵尸用户或沉默用户,在一定程度上保证了实验结果的质量。然后,从不同角度对数据集进行可视化分析,帮助理解用户特征对影响力的影响。最后,针对本文评估模型的实验结果与粉丝数评估方法、中心性分析方法以及传统的PageRank算法进行结果对比与分析,从理论与实践的角度说明本文所提评估模型的合理性与有效性。
其他文献
K-means聚类算法是一种基于划分的聚类算法,在众多聚类算法的性能比较中,该算法具有效率高、可发现任意聚类形状、对数据输入顺序不敏感、且对于高维数据也有较好的性能,而得
海洋平台是人类在海洋作业的重要基础设施之一,也是在海洋中开采石油资源和天然气资源的必要工具和设备,海洋平台长期受到海洋环境复杂性和不确定性等因素的影响导致海洋平台
随着大规模分布式并行应用的兴起,越来越多的计算机加入其中,极大的提高了系统的计算能力。而另一方面,计算机自身的不稳定性,给系统带来了许多隐患,降低了系统的可靠性。恶意的计
本文对数字水印的分类、主要特点以及数字水印系统的基本框架和数字水印技术的常用算法进行了介绍。针对目前的大部分多重水印算法虽然能嵌入多个水印但无法验证水印作品的多
流媒体技术的出现可以使得视频通过网络从媒体服务器向用户计算机连续、实时的传输。用户不必等到整个文件下载完毕就可以收看到媒体内容,这充分满足了用户的实时交互需要。
信息检索时,需求的模糊导致查询结果不尽人意。为使检索更有效,需采用各种相关反馈途径对检索策略进行修改,以发现用户的信息需求。近年来,研究者提出了基于各种检索模型下的
企业网中,各分支机构内部网络的规划与实现和局域网技术的发展是密切相关的。此网络设计方案中采用了虚拟网技术(VLAN)。虚拟网络把交换机组成的网络在逻辑上分割成若干个广播