论文部分内容阅读
社会网络将社会关系映射为网络结构,利用各类数理统计、数据挖掘方法,深入分析关系结构。社会网络分析方法广泛应用于各类实际问题中。其中,社团发现的核心任务是挖掘出社会网络中潜在的、具有某类特征的社团和社团结构,为科学研究和工程应用提供数据基础,是社会网络分析领域研究的热点问题之一。 针对社团发现问题的研究中,大多数都是从宏观角度,即从整体社会网络入手,挖掘潜在的社团结构。而在实际应用中,需要从网络中获取某个特定节点的社团结构,该个人中心网络社团结构能够映射出个人网络的社团属性。本文主要研究基于个人中心网络的社团发现算法,同时针对海量社会网络挖掘问题,研究基于MapReduce的并行化个人中心网络社团发现算法,最后对社团发现算法结果的可视化展开初步研究。论文的主要工作包括: 1.本文概括了社会网络分析中社团发现问题的研究现状和主要技术。分析社团发现研究领域中已经取得的进展,以及当前存在的问题; 2.提出一种基于因子图模型的个人中心网络的社团发现算法; 3.基于Hadoop分布式计算框架和MapReduce编程模型,实现了一种并行化的个人中心网络社团发现算法; 4.在不同数据集上验证并行化个人中心网络社团发现算法的有效性,分析算法的性能。同时,在自主研发的海量数据挖掘工具箱DODO中,运行并行化的个人中心网络社团发现算法,并通过可视化方法展现其结果。