论文部分内容阅读
随着现今计算机运算与处理能力的迅猛发展,人们意识到现实世界网络并不是规则网络,也不同于随机网络,是具有小世界、无标度、自相似、自组织等特性的复杂网络。复杂网络中一个重要的共有属性是社区结构,它在现实世界中非常常见。社区往往对应于系统的功能单元,在新陈代谢网络中,这类功能单元对应着循环或代谢路径;在蛋白质相互作用网络中,功能单元对应着生物细胞内具有相似功能的蛋白质。因此发现网络中潜在的社区结构对揭示网络的特征与内在联系至关重要。
论文完成的主要工作和创新点体现在以下四个方面:
(1)针对传统遗传算法在复杂网络社区发现中存在的问题,提出一种基于改进遗传算法的社区发现算法CDIGA。算法中采用基于基因座邻接的方法表示种群个体,并引入安全个体的概念解决了连接的有效性问题;采用Markov随机游走方法初始化种群,提高初始种群的精度;提出多样性选择算法DCA以及基于节点度排序的变异节点选择方法NDS,提高了解的多样性、算法的收敛性和全局最优搜索能力;并使用社区得分作为社区结构优劣的评价指标,更好的完成社区划分。
(2)针对重叠社区的结构特点和原始个体表示方法无法表示的问题,提出一种重叠社区发现算法OCDIGA。该算法采用基于线图的种群个体表示方法,不仅考虑了节点与直接邻居节点的关联,同时考虑了节点之间的间接关系。对线图表示的种群采用CDIGA的算子,进行遗传操作,并采用社区得分进行划分评估。最终通过解码,可获得合理的重叠社区结构,对于重叠节点的特征发现具有重要意义。
(3)依据多目标优化理论,通过改进精英策略和多项算子,提出了基于可控精英保留策略的多目标演化算法CEMOGA,该算法克服NSGA-Ⅱ中解多样性不足以及过早收敛的问题,为后续在社区发现中的应用奠定了基础。
(4)以CEMOGA算法为基础,提出基于多目标优化理论的复杂网络社区发现算法CEMOGA-CD。该算法通过优化社区得分和社区适应度两个目标函数,获得Pareto优解。通过使用模块度函数、社区强度、标准化互信息等评价函数,可以获得不同网络层次下的社区结构,发现隐藏在社区内部的聚类信息,克服了仅仅通过最大化模块度函数获得社区结构所带来的分辨极限问题,满足了针对不同需求的多尺度,多层次下不同社区结构的获取。
在人工生成网络与现实网络中,采用多种度量指标进行了实验分析。结果表明,上述算法均是行之有效的的社区发现算法。
论文完成的主要工作和创新点体现在以下四个方面:
(1)针对传统遗传算法在复杂网络社区发现中存在的问题,提出一种基于改进遗传算法的社区发现算法CDIGA。算法中采用基于基因座邻接的方法表示种群个体,并引入安全个体的概念解决了连接的有效性问题;采用Markov随机游走方法初始化种群,提高初始种群的精度;提出多样性选择算法DCA以及基于节点度排序的变异节点选择方法NDS,提高了解的多样性、算法的收敛性和全局最优搜索能力;并使用社区得分作为社区结构优劣的评价指标,更好的完成社区划分。
(2)针对重叠社区的结构特点和原始个体表示方法无法表示的问题,提出一种重叠社区发现算法OCDIGA。该算法采用基于线图的种群个体表示方法,不仅考虑了节点与直接邻居节点的关联,同时考虑了节点之间的间接关系。对线图表示的种群采用CDIGA的算子,进行遗传操作,并采用社区得分进行划分评估。最终通过解码,可获得合理的重叠社区结构,对于重叠节点的特征发现具有重要意义。
(3)依据多目标优化理论,通过改进精英策略和多项算子,提出了基于可控精英保留策略的多目标演化算法CEMOGA,该算法克服NSGA-Ⅱ中解多样性不足以及过早收敛的问题,为后续在社区发现中的应用奠定了基础。
(4)以CEMOGA算法为基础,提出基于多目标优化理论的复杂网络社区发现算法CEMOGA-CD。该算法通过优化社区得分和社区适应度两个目标函数,获得Pareto优解。通过使用模块度函数、社区强度、标准化互信息等评价函数,可以获得不同网络层次下的社区结构,发现隐藏在社区内部的聚类信息,克服了仅仅通过最大化模块度函数获得社区结构所带来的分辨极限问题,满足了针对不同需求的多尺度,多层次下不同社区结构的获取。
在人工生成网络与现实网络中,采用多种度量指标进行了实验分析。结果表明,上述算法均是行之有效的的社区发现算法。