Hadoop下基于边聚类的重叠社区发现算法研究

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:guiminzhu18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界充满了各种各样的关系,这些关系用拓扑学的原理可以简化为一张一张网络图。因此复杂的世界可以用一张张网络图表示。关系紧密的节点可以划分在同一个社区中,因此可以将所有节点划分在若干社区中,即复杂网络的划分。根据复杂网络的拓扑结构,揭示其隐含的规则、预测其所存在的行为模式往往具有十分重大的现实意义和理论意义,特别是在社会关系网、生物关系网、互联网和移动互联网中具有重大的理论意义和实用价值。但现实世界中人与人,物与物,人与物之间的关系更为复杂,往往一个节点同时属于多个社区,即重叠社区的发现问题。因此对重叠社区的发现问题比普通复杂网络的划分往往更具有重要的现实意义。自2000年开始,科学研究者用多种方法研究重叠社区的发现问题,采用了例如基于团渗透改进的思想、基于模糊聚类的思想、基于非负矩阵分解的思想、基于种子扩展思想的思想以及基于混合概率模型的思想,取得了不少成果。但是这些算法对于发现大规模复杂网络的重叠社区问题上,在划分准确度、时间复杂度方面有一定的缺陷性,往往不能在实际大规模复杂网络上进行应用。为了解决这个问题,本论文提出了一种新颖的算法,采用对边根据边结构相似度进行聚类,然后通过分布式处理,以此来解决大规模复杂网络的问题。通过实验进行验证,该算法能很好的发现复杂网络的重叠社区结构。并且采用了分布式处理的思路,能很好的解决大规模复杂网络的重叠社区发现问题。
其他文献
本文主要针对具有箱式约束的非凸非光滑问题的优化方法作深入研究,借助于规范对偶理论,巧妙地将一类难以求解的带有箱式约束的非凸非光滑优化问题作规范对偶变换,等价转化为
自然科学以及社会科学的许多问题常可以用时滞微分方程模型来描述。根据时滞的有界性,时滞微分系统又分为无界(无限)和有界(有限)时滞微分系统两类。一般来说,有界时滞微分系
随着现代工程技术的发展,工程结构的精细分析越来越多地需要考虑结构的多相耦合作用。本文基于SiPESC平台针对一类流固耦合问题作分析并探讨了数值实现方法。主要包括大跨度
函数逼近是逼近论的一个重要组成部分,随着科学技术的迅速发展,它与小波分析,神经网络,统计等有着紧密的联系.本文主要研究了Szasz-Mirakjan算子的正则性,以及Szasz-Mirakjan
经过国内外学者多年来的深入研究,结构拓扑优化的理论及其方法不断成熟和完善,逐渐成为工程优化设计的有力工具之一,许多商用CAE软件都相继集成了结构拓扑优化功能模块。但是
本文主要讨论了Hopf群余代数的广义Ore扩张成为Hopf群余代数的充要条件和特殊的相关Yetter-Drinfeld模范畴yDBαC上的(D,H)-Hopf漠结构定理.论文主要分为三个章节:第一章,给出
精原干细胞在经过一系列复杂而又有序的细胞分化过程后最终形成成熟精子,诸多相关研究已经证明精子中不仅存在RNA,精子中基因的表达也会受到相关转录因子的调控。越来越多的
2012年至2014年5月-10月,我们对吉林省五处不同林龄次生林的繁殖鸟类群落进行了物种种类、数量和功能特征的调查。结合2011年的数据,在对调查的结果进行了全面分析后,本文对
设V是由n(n>0)个元素所形成的集合,V中的某些二元子集所形成的集合记作E.称有序对G=(V,E)是一个无向图,其中V中的元素称为图G的顶点,E中的元素称为图G的边.V称为图G的顶点集
天冬氨酸激酶(Aspartate kinase,AK)是一种控制生物合成工业中重要天冬氨酸族氨基酸的关键酶,受支路代谢终产物调控。本研究通过改善AK活力,达到解除其在天冬氨酸族氨基酸代