基于局部扩充的重叠社区发现算法研究和改进

来源 :重庆大学 | 被引量 : 0次 | 上传用户:cao678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的飞速发展以及社交媒体的广泛应用,使得人与人之间的联系尤为密切。这种错综复杂的关系组成一个庞大的社交网络,因此吸引了众多学者致力于复杂网络的研究,从复杂网络中发现并抽取其中的模块结构这就是所谓的社区发现。以前学者都致力于非重叠网络的研究,然后这在现实生活中是不实用的,由此引发了大家对重叠网络的研究,近几年来取得了不小的进展。本文即针对重叠社区发现算法进行改进。重叠社区即网络中包含的节点不止属于一个社区,能够有效地识别这些重叠节点是本文算法研究的重点。比较有名的算法有LFM算法和GCE算法,它们都是利用网络的局部信息,对单个种子节点进行成长的理念。本文鉴于局部扩充的核心思想,对种子选择、社区扩充剪枝、相似度判断、并行化模型等提出了自己的改进方案。(1)由于LFM算法选择种子节点过于随机,影响算法准确性;而GCE算法需要找到网络图的所有团结构,影响算法效率;本文采取折中策略,通过删除网络中影响力较小的节点来得到核心结构。主要基于度数较多的点在社团结构中是比较重要的节点,如果一个节点的影响力较大那么它邻居节点也是重要的。(2)LFM算法和GCE算法在对一个种子进行扩充时并未对其候选集进行判断,这严重影响了算法性能。本文对扩充过程进行了细致的推导和严格的数学证明,对社区扩充过程产生的候选集进行了剪枝处理,以进一步的提升算法效率。(3)种子扩充后生成的社区存在一定的相似性,如果不加以判断会对结果准确性产生影响。本文提到的相似度度量公式除了考虑社区节点集合还考虑了社区邻居节点的影响,更具有实际意义。(4)对扩充过程进行并行化处理。并行化是提高算法性能的一个很重要的手段,通过分析本文算法过程,可以方便的解除数据依赖,并且引入生产者消费者模型来解决线程通信问题。由于硬件环境限制实验在多核CPU上进行操作。(5)通过应用到实际网络图中验证了种子选择策略在一定范围之内的可行性,以及综合改进算法ISA对于社区发现的准确性以及时间损耗。准确性用NMI(标准互信息量)进行度量,发现本文算法对于混淆参数以及社区结构敏感,总体性能优于LFM算法,且不逊于GCE算法。
其他文献
随着科学技术的快速发展,各种软件产品出现在人们的生活当中,因此人们对于软件质量的要求也逐渐提升。软件测试是比较复杂耗时的,然而良好的软件测试方案,测试方法对于减少软
三维扫描技术由于在生产生活中有着广泛的应用而受到了很大的关注。可移动式三维扫描技术受外界约束少,能较快完成扫描任务,是三维扫描技术研究中的热点之一。常见的可移动式
随着Internet的迅速发展,现有的IPv4协议在应用中出现了很多不足,如地址资源即将耗尽以及对安全性无法保证等。IPv6的出现为互联网的发展带来了新的希望,它取代IPv4成为了发展的
随着彩色图像在现实生活中的各个领域得到广泛应用,颜色也成为衡量图像质量的主要标准,因此,获取和显示精确的颜色变得越发重要。传统方法中颜色的信息都是与设备相关的,存在
电子邮件的兴起伴随着垃圾邮件的产生,随着互联网的普及和发展,电子邮件成为人们日常工作和生活中必不可少的交流方式,甚至已经成为文件和文档进行快速传输的主流载体。而垃
无线传感器网络(Wireless Sensor Network,WSN)是由具有传感功能和无线通信功能的设备自组成形成的无线网络系统,其用途就是通过广泛分布的传感器节点将采集到的数据发送给观
进入21世纪以后,计算机几乎涉及了所有领域。目前,我们人类期望能够使用计算机及相关设备对人的视觉进行一种模拟。同时由于近些年多媒体技术飞速发展,导致视频采集十分便利,
随着计算机图形学的发展,以实时图形渲染为基础的虚拟现实技术已经应用在越来越多的领域。在虚拟的场景中加入真实感的地形可以极大的提高系统的沉浸感,LOD是大规模地形渲染
随着三维激光扫描仪等三维数据获取技术的发展,三维模型建模技术己成为研究热点。基于点云和网格表示的三维模型广泛地应用于计算机辅助设计,虚拟现实,可视化等领域。三维模
机器学习、信号、图像处理、计算视觉中会出现高维数据,高维数据不仅增加算法的计算时间和内存需求,同时也因“维数灾难”降低算法的有效性,高维数据中常会潜藏着一个低维结