基于改进标签传播算法的社区发现研究与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hfutnyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界的大量复杂系统都可用复杂网络进行建模分析,而社区发现是复杂网络分析中的热门问题。社区发现能够帮助挖掘复杂系统内部个体间的聚集结构,分析个体与个体间的关联,掌握复杂系统的发展规律,发现复杂系统的隐藏功能等等,具有重要的研究价值和意义。社区发现算法中的标签传播算法由于其思想简单和实际复杂度低,而受到广泛关注。然而该算法对于标签的随机更新,导致了算法稳定性差和准确率低的情况,为了解决以上问题,本文主要做了如下几个方面工作:(1)本文对现有的标签传播算法进行了总结和分析,提出了一种改进的标签传播算法(Link Label Propagation Algorithm,简称LLPA),该算法分为三个部分,第一个部分为将原始网络图转换成边图,边图保留了原始网络图的所有的拓扑网络结构;第二部分是利用改进的标签传播模型来对边图进行非重叠社区划分,首先,计算节点的重要性程度并按照降序排列,然后利用节点的排序结果找出网络的极大团,作为初始的社区核心,在标签的初始化阶段,每一个初始社区都会被赋予一个唯一的标签;第三部分是将边图重新还原成原始的网络结构图,通过遍历第二部分划分出的社区,将社区里的每个节点恢复成原始网络中对应的两个节点,使非重叠的社区发现变成重叠的社区发现。最后,分析了该算法的复杂度和扩展性,同时通过人工网络和真实世界网络的实验和对比证明了该算法的性能得到了提升。(2)本文实现了基于社区发现微博用户行为分析系统的系统原型,系统采用了 Spark框架、Kafka中间件、分布式存储及OLAP框架等先进技术,使该系统在可扩展性和容错性方面有着明显的优势。该系统的主要功能为用户行为分析和用户影响力分析,其中在用户行为分析部分,使用本文提出的改进的标签传播算法进行兴趣社区划分。
其他文献
本文主要考虑半线性分数阶Laplace方程(-?)α/2u=φ(x,u)在Rn中.正的整体有界解,其中(-?)α/2是分数阶Laplace算子,0
颜李学派是清初非常重要的学术流派。颜元、李塨二人所倡导的以“三事三物”为核心的习行经济与事功之学带有一定的复古色彩,同时形成了在中国思想史上独树一帜的实学思想体
荧光探针因其响应迅速、高选择性、高灵敏度、样品用量少、操作简单等优点而被广泛应用于环境监测、食品安全、生物传感等领域。芘及其衍生物是一类性能优异的荧光材料,具有
抑郁症是一种常见的精神疾病。根据2017年世界卫生组织公布数据,全球有超过3亿抑郁症患者。目前,诊断抑郁症主要依靠医生的临床判断,辅助方法则是患者的自评量表和他评量表。
太阳高能粒子(SEP)事件的产生与日冕物质抛射(CME)爆发之间的关联是空间天气研究领域的一个非常重要的问题。虽然所有的缓变型SEP事件都与快速CME爆发关联,但也存在很多大CME
鳄类的性别决定方式为温度性别决定(temperature-dependent sex determination,TSD),目前其性别决定的分子机制还不清楚。本文以扬子鳄(Alligator sinensis)为研究对象,对扬
传统识别主要利用体外物(密码、证件和钥匙等)进行身份验证,而这些体外物很容易遗失或被盗窃,因此,生物识别的优势逐渐开始显现。生物识别的独特性、永恒性、安全性和便利性
飞行器半实物仿真数据在优化飞行器设计方案、故障诊断、仿真环境改善等方面具有无法替代的作用,高效完整安全地管理飞行器半实物仿真数据意义重大。然而,现有数据库系统和分
这篇文章主要计算了Temperley-Lieb代数的Hochschild上同调的Gerstenhaber代数结构.
19世纪末20世纪初,随着俄国社会的发展,腐朽的沙皇专制制度引起了人们的不满,俄国国内革命运动高涨,而日俄战争的失败,又加剧了社会矛盾。在沙皇面临统治危机时,他任命强势人