论文部分内容阅读
近年来,许多应用中的数据其特性随时间动态变化,在不同时间段上,分析和挖掘这类数据的特性已成为一个新的热点问题。针对这类问题,演化聚类(evolutionary clustering)中的时间平滑性框架被提出,并且已经得到学术界和工业界的广泛关注。演化聚类中提出的时间平滑性框架具有如下特点:(1)聚类结果能很好地符合当前时间段上数据的特性;(2)聚类结果和最近的历史类簇结构尽可能地相似,以实现各时间段上类簇的平滑。演化聚类中的这两个特点相互冲突,一个性能的提高必定引起另一个性能的降低。进化多目标优化算法(EMOA)是近年来发展起来的一种利用进化计算方法求解多目标优化问题的新的优化算法。由于其具有高效、实用的特点,越来越受到学术界的重视。针对演化聚类框架中两个目标函数间相互冲突的特性,利用进化多目标优化方法处理这类问题的算法被提出。第三章将进化多目标优化方法引入演化聚类,构造了一种新的演化聚类方法——基于分解的进化多目标演化聚类算法。在该算法中,我们使用MOEA/D同时优化演化k-means (?)中两个相互冲突的函数,克服了传统方法中需要提前设定权重参数的缺陷。另外,由于进化计算的引入,加强了算法的搜索能力,相比已有算法可以找到更好的解。通过对人工数据集和UCI数据集的处理,验证了我们算法的性能。第四章将基于进化多目标优化的时间平滑性框架用于动态网络社区检测,构造了一种新的网络社区检测方法——基于进化多目标优化的动态网络社区检测算法。在该算法中,首先通过合适的社区质量函数和历史代价函数评价动态网络的社区质量和历史代价,然后利用MOEA/D同时优化这两个相互冲突的目标函数,得到一组最优解,这有效地克服了传统方法中需要提前设定权重参数的缺陷。其次,合适的基因编解码方法使得算法可以自动确定社区模块数,并通过采用合理的交叉、变异算子提高了算法的搜索能力。最后,通过对人工合成网络中社区结构的检测,验证了我们的方法比现有的其他方法具有更好地检测社区结构的能力。第五章在第四章给出算法的基础上,针对动态网络社区检测这一特定问题加入了相应的局部搜索策略,进一步提高了我们算法处理复杂动态网络的能力。并且,通过对人工合成网络和现实网络的处理,验证了我们算法的性能。