论文部分内容阅读
现实生活中存在众多复杂的系统,这些系统构成了抽象的复杂网络。近些年来研究者们对复杂网络的研究产生了浓厚的兴趣,其中复杂网络聚类方法研究成为一个热点研究问题。复杂网络聚类的目的是挖掘出给定网络中具有一定拓扑属性的社团结构,复杂网络聚类分析极大地促进了复杂网络的拓扑结构分析、网络行为的预测以及网络潜在功能的挖掘,该研究已成为一个具有重要的社会价值及应用价值的研究课题。本文对非交叠复杂网络聚类和交叠网络聚类进行了研究,分别为该两类研究问题建立了相应的高效的网络聚类算法。本文的主要工作如下:(1)针对当前比较流行的网络聚类判别准则各自存在一定的不足,提出了一种基于连接强度的网络聚类遗传算法,该算法引入了连接强度作为聚类判别准则,并用它对社团进行扩展,使之在兼顾密度的同时又能很好地区分网络拓扑结构。算法中提出了一种快速有效的基于连接强度的局部搜索策略,避免了现有网络聚类遗传算法局部搜索能力不足所带来的问题;同时,为了综合考虑初始种群的多样性以及聚类精度,促使基于连接强度的局部搜索策略的搜索性能达到最优,提出了基于连接强度的初始种群生成方法。在随机网络和真实网络上进行了测试,并与经典的网络聚类方法进行了比较,实验结果表明了该算法能够较好地挖掘网络社团结构,验证了该算法的可行性与有效性。(2)针对传统以节点为研究对象的点聚类方法中交叠节点难以确定和消除“冗余社团”(同一社团结构被这些高度相似的冗余社团发现很多次)所带来的计算时间与资源浪费问题,同时针对现有的以边为研究对象边聚类方法中边社团难以获取问题,尤其稠密网络中该类方法计算代价非常高的问题,本文提出了一种基于边聚类的交叠社团快速检测算法。算法利用传统的以节点为研究对象的方法得到基于中心团扩展的局部社团结构,并记录其为对应的边社团。然后利用网络中的边属于多个边社团并无实际意义的事实,剔除网络中边社团中的边,最后巧妙地实现了交叠社团检测。该算法能有效提高网络聚类的计算效率,随机网路和真实网络上的实验结果表明,与其它算法性能相比较,本文提出的算法很大程度上降低了算法时间复杂度,尤其针对大规模的复杂网络优势更明显,同时网络聚类的质量得到了一定的提高。