基于隶属度传播的重叠社区发现算法

来源 :吉林大学 | 被引量 : 0次 | 上传用户:down222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络可以自然的表示许多复杂问题,因此复杂网络可以用来解决现实世界中存在的许多问题。在许多不同的领域中,复杂网络的表示是不一样的,如在社会领域有社会关系网络,在生物学领域有基因调控网络、蛋白质相互作用网络等。在这里,复杂网络通常具有可辩别的社区结构。社区结构可以被看作一种“网络簇”。在复杂网络中,属于同一个社区的节点彼此之间密切相连,社区内存在大量的内部边,而来自不同社区的节点相互之间连接稀疏,同时网络中存在少量的跨社区相连的边。因此社区内的边稠密的,但社区之间的边是稀疏的。一个复杂网络能够包括许多社区,不同的社区之间相互关联,属于同一社区的节点之间具备类似的功能或者性质,不同的社区中的节点具备差异较大的性质或功能。例如,在社交网络中同一社区中的人具有相同的职业或工作;在蛋白质相互关联网络中,属于同一社区的蛋白质之间也许具有相近的功能。在真实世界的复杂网络中,不同的社区之间存在交互的现象,即不同的社区之间会有部分区域相互重叠,存在一个节点同时属于多个社区的情况。我们将这些节点称为重叠节点,将相互重叠的社区称为重叠社区。重叠节点与重叠社区广泛的存在于现实生活中。例如,社交网络中存在多个社区,一个社区可以代表一个家族,也可以代表一个公司的同事,一个人可以同时在家庭和公司中担任角色与职责;在生物分子网络中,不同的社区可以代表不同的生物功能表达过程,而一个基因或者蛋白质可能在多种生物功能中发挥作用;在学术圈中,一位学者往往涉及多个领域。重叠节点在复杂网络中往往占有重要地位。由于重叠节点可以属于多个重叠社区,它们连接着多个不同的社区,所以重叠节点在信息流通等方面起着枢纽的作用,也因此重叠节点的识别是重叠社区发现的重要一环。通过引入隶属度的概念,本文提出了一种基于隶属度传播的重叠社区发现算法。算法为每个节点设立一个缓冲区,在缓冲区中存储多个标签以及每个标签对应的隶属度,该隶属度表示当前节点属于对应潜在社区的可能性,每次迭代对每个节点的缓冲区进行更新。在该算法中,隶属度的传播是由全局和局部信息共同驱动的,并最终用于判断节点所属社区。我们将所提出的算法应用于LFR benchmark数据集和真实世界数据集,并将实验结果与现有的社区发现算法进行比较。结果表明,我们提出的基于隶属度传播的算法效果显著,并且在大多数数据集上都优于比较方法。特别地,它显著地提高了重叠节点预测的性能。综上所述,本文所做的主要工作有:提出了一种新的基于隶属度传播的重叠社区发现算法,并对算法的主要步骤进行详细阐述;在LFR benchmark数据集和真实数据集上进行实验,并将社区划分结果与其他的社区划分算法进行比较;对划分结果采用NMI,Omega指数,模块度等方法进行了详细分析。实验结果表明本文方法与已有算法相比,显著提高了社区发现效率和重叠节点的识别效果。
其他文献
本文主要对一类Steiner三元系的结构性质及其同构类进行了研究.同时,基于有限环上的编码理论,研究了两类有限环上的迹码.1、本文证明了阶为3w+3且包含至少一个横截子设计TD(3,w)的Steiner三元系(STS)的若干结构性质.通过彻底详尽地搜索,我们找到了阶为21且包含一个横截子设计TD(3,6)(等价于一个6 × 6的拉丁方)的STS(21)的全部2004720个同构类.2、在环Fp+u
金融创新的快速发展推动了影子银行的产生,并对传统金融体系具有重要补充作用。但是,影子银行的并没有受到严格的监管。金融危机爆发后,欧美等西方国家意识到了对影子银行监
在习近平新时代中国特色社会主义思想的引领下,十九大提出了到2020年全面建成小康社会,目前正在进行以人民为中心下的精准扶贫脱贫攻坚战和乡村振兴。河源市是山区,“三农”问题对经济社会发展的制约作用日益凸现,脱贫攻坚时间紧、任务重,必须真抓实干、埋头苦干,需要大量的资金确保本地区如期脱贫。因此,以河源农村社会、经济、环境、人文建设等为切入点,从河源财政支农资金的管理运作以及经济可持续发展的角度出发研究
随着信息技术的发展和大数据的兴起,互联网成为了人们发布和获取信息的重要来源。其中,用户产生的大部分信息以文本的形式积累在网络中。如何从这些大规模非结构化文本中,挖
网络流量测量是指对网络中的流量信息进行统计,进而为流量规划、入侵检测以及网络异常检测等网络管理应用提供输入信息。传统网络架构存在许多缺陷,例如缺乏灵活的控制能力和基本的网络测量功能,从而导致测量任务实施复杂,支持的测量粒度粗,测量准确性低等问题。而在可编程网络中,由于交换机具有可编程性,因此可以在交换机上灵活地部署定制的网络流量测量功能,为细粒度的网络流量测量奠定了基础。本文主要对可编程网络中的流
物联网是新一轮科技革命的核心驱动,是引领社会发展的重要力量。射频识别是一种典型的反向散射通信技术,它通过从射频信号中收集能量来使得通信设备摆脱固定电池的束缚,一定程度上解决了物联网中传感器的能源问题。然而,现有射频识别系统需要读写器发送专用的射频激励信号来激活标签,系统的通信距离和部署灵活性受限,无法满足未来物联网通信的需求。环境反向散射通信(Ambient Backscatter Communi
互联网非公开股权融资是在互联网的快速发展和普惠金融背景下产生,作为一种新兴的融资模式,它为经济发展注入新的血液,激发各创新群体的活力与积极性,进一步营造“大众创业、
现实世界中的许多复杂系统都可以抽象地表现为网络形态,随着大型网络数据可用性的提高,以及学者们对复杂网络定量、定性特征研究的深入,大型复杂网络的研究已变成一门极具意义的课题,而找寻复杂网络数据中的社群结构正是其中被着重研究的难点之一。2017年,一种围绕找到社团中心点继而吸引拉拢周围其他点的类天体万有引力的基于种子点选取的重叠社区发现算法(CNS)被提出,随后,在2019年被提出的一种融入了其他天体
近年来深度学习技术在各行各已经起着越来越重要的作用,但是深度学习算法能够取得良好性能的关键是建立在需要消耗大量的资源对深度学习模型进行训练的基础上的,这个过程不仅
狂犬病(rabies)是由狂犬病病毒(rabies virus,RABV)引起的具有高度神经嗜性的烈性人兽共患传染病,致死率达100%,已成为一个重大的公共卫生问题。该病目前无特效疗法,而通过暴露前