论文部分内容阅读
社会网络是由个人或组织以及它们之间的联系所构成的集合,社会网络一般都会呈现高度的社区性,这是社会网络与随机网络的最大不同。近几年随着互联网和社会网络网站的飞速发展,大规模的社会网络逐渐成为研究的热点。目前社区发现技术已经日趋成熟,但是目前的社区发现算法多半无法适应大规模的社区网络。主要工作是研究目前一些社区发现算法的效果及遇到的主要问题,提出一种基于核心成员的社区发现及演变过程追踪模型,通过进行相关实验及比对实验,分析模型的正确性。取得了以下几个方面的研究成果:(1)提出一种基于核心成员的社区发现算法。首先找出网络中的核心成员,然后将与核心成员联系紧密的非核心成员划分到核心成员所在社区,最后使用Average linkage算法对初始社区划分结果进行合并,得到最终社区划分结果。本文提出算法可以通过调节阈值控制社区发现时间,阈值和社区发现的精度成反比,阈值大则社区发现的速度快,社区发现的精度低,阈值小则社区发现的速度慢,社区发现的精度高。(2)分析网络社区的动态特性。一是大的社区将存在较长的时间;二是大的社区成员稳定度低,大部分的成员只连续存在一到两个时刻,只有小部分核心成员有较长的生命周期。(3)提出一种基于核心成员的演变追踪模型。在社区发现的基础上,结合社区的时间特征追踪社区的演变状况。通过实验验证社区演变追踪算法的有效性并分析社区演变的原因。实验证明我们的算法可以快速的发现复杂网络中存在的社区,同时本文提出的模型有效利用社区中核心点来为两个处于不同时间段的社区之间建立演化关系。分析社区的变化情况。这种方法非常适合于处理大规模数据集。