个人中心网络社团发现算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:applexiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络将社会关系映射为网络结构,利用各类数理统计、数据挖掘方法,深入分析关系结构。社会网络分析方法广泛应用于各类实际问题中。其中,社团发现的核心任务是挖掘出社会网络中潜在的、具有某类特征的社团和社团结构,为科学研究和工程应用提供数据基础,是社会网络分析领域研究的热点问题之一。  针对社团发现问题的研究中,大多数都是从宏观角度,即从整体社会网络入手,挖掘潜在的社团结构。而在实际应用中,需要从网络中获取某个特定节点的社团结构,该个人中心网络社团结构能够映射出个人网络的社团属性。本文主要研究基于个人中心网络的社团发现算法,同时针对海量社会网络挖掘问题,研究基于MapReduce的并行化个人中心网络社团发现算法,最后对社团发现算法结果的可视化展开初步研究。论文的主要工作包括:  1.本文概括了社会网络分析中社团发现问题的研究现状和主要技术。分析社团发现研究领域中已经取得的进展,以及当前存在的问题;  2.提出一种基于因子图模型的个人中心网络的社团发现算法;  3.基于Hadoop分布式计算框架和MapReduce编程模型,实现了一种并行化的个人中心网络社团发现算法;  4.在不同数据集上验证并行化个人中心网络社团发现算法的有效性,分析算法的性能。同时,在自主研发的海量数据挖掘工具箱DODO中,运行并行化的个人中心网络社团发现算法,并通过可视化方法展现其结果。
其他文献
概念格是数据分析和知识提取的一种有效形式化工具,具有精确性和完备性等特点。粗糙集理论是一种处理不确定、不精确数据的数学工具。本文利用粗糙集理论中的上下近似集,描述