论文部分内容阅读
当今科学技术的迅速发展,使得现实生活中不同领域的各种网络的规模越来越大,承载的信息量也越来越丰富、复杂。随着人类科技水平的不断提高和认识的不断深入,学者们发现许多不同领域不同行业的复杂系统呈现出共同的复杂网络性质,除了短的平均路径长度的小世界统计性质,以及节点的偏好连接、度分布付出幂率分布的无标度统计性质,社区结构也构成了复杂网络的一种重要结构特征。社区结构表现为社区内节点间联系紧密、社区间联系稀疏的聚团性质,发现社区结构对于人们分析复杂网络的拓扑结构,理解它的隐含模式以及预测复杂网络的行为具有非常重要的理论意义,在社会网络、生物网和Internet中都具有广泛的应用。本文对复杂网络中社区发现算法进行了相关的研究。首先介绍了复杂网络社区结构研究的目的和意义及相关挑战,接下来对有关复杂网络的基本知识以及它们的表示方法做了简单的说明,然后从图形分割和分级聚类两大类型对传统的复杂网络社区结构发现方法进行了阐述。其中图形分割的经典算法有Kernighan-Lin算法以及谱平分法,分级聚类算法有基于分裂思想的GN算法和基于凝聚思想的NF算法,本文在对这些算法的核心思想进行描述的同时分析了当前算法存在的不足。在对传统的社区发现算法分析的基础上,本文采用分层凝聚的思想,提出一种通过模块度最优化方法发现复杂网络中存在的社区的算法。本文对该算法进行了详细的描述,同时利用具体的小型网络,通过该网络的可视化的演变过程,来详细的说明本文提出的算法的具体执行过程。最后通过在基准数据集和真实数据集上的实验,结果表明本算法所发现的基准网络中的社区结构与实际情况很接近,在实际网络中发现的社区结构也具有一定可信性,表明了本文算法的可靠性和高效性。