基于核心顶点扩张的社团检测算法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:leon_xu23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中有许多事物都可以被视为复杂网络,如社会交际圈、论文的引用关系、生物之间的联系、航空线路等。社团是复杂网络中一个最典型的特征结构,社团之间的相互联系决定了复杂网络的构成。通过对复杂网络中社团的研究,可以探索出复杂网络潜在的规律,同时,可以从复杂网络的内部构造中进一步了解网络的性质。社团检测是理解复杂网络的重要方法,可以为现实生活中的很多复杂问题提供解决思路。因此,研究社团检测算法不仅在学术上具有重要的理论意义,而且在实际生活中具有重要的现实意义。目前许多社团检测算法都可以识别复杂网络中的社团结构,本文对已有的社团检测算法进行了深入的研究,发现了算法中的一些问题与不足,如参数难以确定、时间复杂度过高、检测精度较低等。针对这些算法中存在的缺点,提出了两个无需输入任何参数的社团检测方法。第一个是基于PageRank的核心顶点扩张社团检测算法(CEPR)。CEPR关注的是如何检测到尽可能准确的、高质量的社团结构,以改善一些社团检测算法检测精度不高的问题。该算法将相似的顶点分配到同一个社团后,再利用PageRank算法发现复杂网络中的核心顶点并进一步划分为核心社团,然后把剩余未标记的顶点按照度的大小加入到核心社团中,最后通过社团间的合并形成稳定的社团结构。实验部分在九个包含不同结构、不同规模的网络数据集上,与四个算法进行了比较。而且,还利用三种常用评价指标对CEPR进行了全面的评价,展示了该算法的有效性。实验结果表明,CEPR整体上比对比算法更优,能更准确地检测出社团结构。第二个是基于局部密度的核心顶点扩张社团检测算法(CELD)。CELD注重的是如何从复杂网络中快速地获取准确的、合理的社团结构,以克服一些社团检测算法时间复杂度较高的缺点。CELD定义了一个选择核心顶点的局部密度公式,即顶点的局部密度与其邻居的个数成正比,与邻居点到该点间的距离和成反比。该算法先将相似的顶点放到一个社团中,接着根据局部密度对顶点进行排序并将密度较大的顶点视为核心顶点,然后将剩余的顶点分配到核心社团,最后通过合并社团得到合理的社团结构。本文在实验部分与四个社团检测算法在六个有真实社团结构、三个无真实社团结构的大网络数据集上进行了比较显示,同时通过三种评价指标对该算法进行了评价。实验结果显示,CELD拥有较低的时间复杂度,并且结果大多数情况下优于对比算法。两个算法都可以在无需任何输入参数的条件下,得到更准确的社团结构。其中,CEPR算法能够合理的选择核心顶点,而CELD算法能够在较低的时间复杂度下更高效地工作。
其他文献
随着信息技术的发展,特别是国际互联网的发展,依托信息技术为基础的数字化学习资源已经非常丰富。从21世纪初国内大规模开展网络教育,现已经有.十多年时间。这十多年期间开发
目的:将液质联用技术应用于药品生产过程的质量控制。建立了注射用盐酸头孢吡肟UPLC-Q-TOF-MS/MS液质联用杂质分析方法、抗菌乳膏可疑非法添加活性成分的UPLC-QQQ-MS/MS(MRM)液
目标跟踪一直以来都是计算机视觉研究的热点问题,在国防军事、智能交通和生活安防等众多领域得到了广泛的应用。近年来,视觉显著性检测技术的研究取得了实质性的进展和突破,
推进安全风险管理是实现铁路科学发展、安全发展的重要举措,是贯彻"安全第一,预防为主,综合治理"方针的具体实践,是提升铁路安全工作科学化水平的必然要求,是解决当前铁路运
会议
信息时代的发展,使得人类每天都会处理大量复杂的信息。模式识别能够利用计算机将大量的信息自动分到各自的模式类中,在越来越多的领域中得到了广泛应用。本文的研究目的是提
随着科学技术的快速发展,人们的生活方式发生了翻天覆地的变化。目前,人们对于外界信息的获取,不再只限于电视、报纸等传统媒体,网络已经成为了人们看世界的重要方式。面对网
设施选址问题是一类被广泛研究的优化问题,在互联网、分布式计算和数据挖掘等领域都有广泛应用。设施选址问题一般是从一个对象集合中选择若干对象作为设施来服务其它对象,目
会议
下含D2D蜂窝网(DUCN)是一种新型的网络架构。简单而言,是将端到端直接通信技术(D2D)引入蜂窝网,通过信道复用,为蜂窝(CE)链路和D2D链路统筹分配授权频段资源。这样,一方面,提
研究目的:急性下坡跑运动会造成延迟性肌肉酸痛,延迟性肌肉酸痛引起肌肉收缩功能的下降,影响日常体育活动以及运动员运动训练的进程。目前对于延迟性肌肉酸痛的发生机制尚无