论文部分内容阅读
现实世界中许多系统都可以抽象成复杂网络,复杂网络的一个重要特性是社区结构,社区结构表示具有共同特性的个体的集合,在各种复杂网络中广泛存在,如社交网络中有共同兴趣的用户往往形成同一社区。准确高效的挖掘出网络中的社区结构,可以帮助我们更好地理解网络的拓扑结构,更全面的认识复杂系统的内部规律。但在社区挖掘过程中存在的难以准确选取社区中心、网络节点包含有大量属性信息以及社区之间呈现出重叠特性的问题,导致社区发现的质量不佳。因此,如何设计高效的自动确定社区中心的搜索算法以及融合网络拓扑结构信息和节点属性信息来生成社区划分决策是社区发现研究中需要解决的关键问题。针对这些问题,本文围绕以下内容开展研究:(1)针对现实世界的网络节点中包含有大量属性信息的情况,提出了网络社区本质特征的描述和度量方法。融合网络的拓扑结构和节点属性,定义了节点的密集度和间隔度,分别用于描述社区内部连接紧密和外部连接松散的特点。在社区发现过程中,考虑了拓扑结构和节点属性对社区形成的共同作用关系,可以更准确的表达出网络社区的本质特征。(2)针对社区发现过程中难以准确选取社区中心的问题,提出了自动确定社区中心的快速搜索算法。首先根据社区中心所具有的“有较高的局部密度,且距离密度更高的社区中心较远”的特点将潜在社区中心搜索出来,以便在后续筛选中不漏掉任何一个可能的社区中心,然后再根据距离比较法筛选出社区中心。(3)针对社区之间呈现出重叠特性的问题,设计了非中心节点关于各社区隶属度的迭代计算方法,以实现重叠社区划分。(4)与几个经典的社区发现算法在真实网络上进行实验比较和分析,结果表明本文算法相较于LINK、COPRA和DPSCD等算法,在扩展模块度EQ、精确率、召回率和F1-measure等方面表现良好,提高了社区划分的精度,保证了算法的稳定性。