一种基于完全子图和标签传播的重叠社区检测算法

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:hongguoqwer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重叠社区发现可以帮助人们分析和理解复杂网络,目前已成为数据挖掘的研究热门。随着新的重叠社区发现算法被不断提出,现实的应用情形对算法的时间性能和稳定性要求不断提升,否则在处理大规模乃至超大规模的网络时算法的开销过高,难以投入实际应用。COPRA算法是一种利用标签传播技术来实现重叠社区检测的社区发现算法,它通过标签传播来判断节点归属,并引入了归属系数和阈值的概念,可以有效地完成对重叠社区的检测。COPRA算法时间性能良好,但在处理大规模网络时仍显乏力,另外COPRA算法的稳定性较差,社区发现结果的具有很大的随机性。本文提出了一种基于完全子图和标签传播的重叠社区检测算法(Complete subgraph&Label Propagation Overlap Algorithm,CLPOA),该算法主要基于以下两个关键点进行研究:(1)COPRA算法在标签初始分配阶段赋予每个节点独立的标签,这种分配方法直接导致了COPRA算法时间开销过大。本文分析了社区结构和完全子图的联系,在CLPOA算法的标签初始化过程中利用完全子图替代社区模型,通过搜寻网络中的所有完全子图得到初始社区结构并对每个社区分配唯一标签,该方案理论上拥有更好的时间性能。(2)COPRA算法在标签传播阶段的标签丢弃环节中引入了随机选择策略,算法会在符合条件的多个标签中概率选取一个进行保留,该策略直接导致了算法的不稳定。CLPOA算法提出了接触频数作为标签对节点影响力的参考值,通过比对接触频数来进行标签选择,随机选择策略的执行条件更加苛刻,算法的随机性也会降低,实验结果也会更加稳定。本文选择了海豚社区网络和美国大学生橄榄球联赛两个小型标准网络数据集以及PGP信任网络和cond-mat-2003社区网络两个大型网络数据集来进行实验测试,结果证明了CLPOA算法在保持了和COPRA算法相同的社区划分质量的同时,拥有更好的算法稳定性和时间性能。
其他文献
单独UV-A能够诱导‘津田’芜菁(Brassica rapa‘Tsuda’)花青素的合成,而蓝光不能,这说明可能存在一种新的受UV-A诱导的光受体,参与UV-A诱导花青素合成的光信号转导途径。我
高层管理团队(TMT)是企业最高管理层及决策层,对企业的发展战略及绩效发挥着至关重要的作用。多元化经营作为企业扩张发展的重要途径,犹如一把“双刃剑”,风险与机遇并行,其
在民航工作中,安全是永远的主题。在航空器飞行的各个阶段都会受到气象条件的影响,民航安全与气象条件有着密切的关系。而民航气象作为民航工作的重要组成部分之一,肩负着最
电梯在今时今日的城市中饰演着至关重要的角色,与公共安全息息相关。近几年来,随着城镇化建设进程的加速推进,高层和超高层楼房也逐渐走进了我们的生活,在用电梯的数量也随之
协作通信网络技术利用分布式的概念来共享彼此无线资源以达到空间分集的目的,能有效抵抗衰落、提高传输可靠性和扩大网络覆盖范围。协作通信网络研究中的一个关键问题就是中
随着美国页岩气勘探开发理论的发展与成熟,我国一些地区也相继开展了页岩气地质条件的理论研究工作,并尝试建立适用于各工区的页岩气评价标准。本文以柴达木盆地北缘侏罗系作
邯邢地区是我国重要的大型铁矿基地,大地构造位置属于华北克拉通中部,太行山板内造山带。西石门由于其规模大、储量多,被认为是邯邢式铁矿的典型。但是通过本文在西石门矿床
基数约束稀疏优化模型是指约束上带有l0范数的优化模型。这类模型在信号处理、回归分析、压缩感知以及图像处理等领域有着广泛的应用。随着研究的深入,又被应用到目标检测、
大脑是人体最为重要的器官之一,它负责控制指挥着人体各项重要的生理活动,因此了解其工作特点及原理是一个重要的研究方向。目前人们主要通过大脑的生理电信号了解研究大脑的
社会治理理论创新,是创造良好社会环境的必然前提,是实现治理体系和治理能力现代化的关键。对十八大以来中国共产党的社会治理理论创新进行研究,在当前具有十分重要的理论意义和现实价值。十八大以来中国共产党的社会治理理论创新,离不开改革开放以来中国社会取得的发展、马克思主义中国化的理论基础以及对国外社会治理理论的合理借鉴。党的十八大以来,以习近平同志为核心的党中央从党和国家事业全局的战略高度出发,根据我国社