论文部分内容阅读
20世纪计算机的诞生,推动了互联网技术的发展,开启了人类社会的网络信息时代,无形中被复杂繁多的数据包围。数不胜数的“网络”以有形和无形的方式融入到生活中,从有形的电信网络、交通网络、航空网络、新闻网络等到无形的社交网络、经济网络、军事网络等。这些种类繁多、结构复杂、数据量巨大、具有一定的动态性,且内在结构中有一定的自组织和自形似性等特征的网络被统称为复杂网络。社区结构是复杂网络具有的一个重要特征,是了解一个网络结构的重要途径,如何有效地检测网络的社区结构具有非常重要的现实意义。本文从多目标优化的角度解决网络社区结构检测问题。针对当前多目标优化社区发现算法中存在的计算复杂度高、解多样性不足及局部搜索缺乏等问题。本文以改进后的进化算法为优化框架,同时改善了基因编码方式、遗传操作、优化指标和局部搜索等。本文算法分为两个阶段:首先,确定优化指标MRA、RC和选择遗传操作,改进了MOEA/D框架中一些策略,优化MRA和RC得到Pareto最优解集合,对应多目标的折衷和社区结构;其次,在模型选择阶段采用模块度和NMI方法,得到最佳社区划分。在第一个阶段中改进了基于邻接点的基因编码方式,使每个基因位置都有一个包含两个属性的标签,分别为节点所在的社区LNC和节点的适应度LND,伴随解码过程对其赋值,自动获得网络划分的社区数量。本文中采用基于节点适应度的两点交叉和基因变异遗传操作,设置节点适应度阈值h。在遗传操作过程中,只有节点适应度小于阈值h的基因位置才进行遗传操作,否则不进行。这样可以降低遗传操作的随机性和破坏性,减少种群中的无效个体,使进化趋向有利的方向。在IMOEA/D框中引入了基于变异的局部搜索算法和遗传操作的选择策略,增强了局部寻优能力及增加了个体进行有效遗传操作的概率,从而提高了解的多样性。根据在 LFR__benchmark 与 Karate Club、College Football、Bottlenose Dolphins、Kreb’s Books网络数据集上的实验,验证了本文提出的改进方法具有良好的社区发现能力,并以较强的稳定性和较低的复杂性优于其它算法。