大数据平台下基于图划分的最大团问题求解方法研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:kjnojn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最大团问题作为图论中经典的组合优化问题,属于NP完全问题,即搜索无向图中规模最大的完全子图。最大团问题的应用范围十分广泛,如模式识别、人工智能、子图同构等等。在社会网络分析中,可通过搜索社会网络中的最大团进一步挖掘社会网络中的用户行为特征和社团结构。因此,求解最大团问题在理论研究和实际应用中都具有重要的意义。随着问题研究的深入以及图规模的指数级增长,确定性算法的求解时间过长,使得启发式算法逐渐成为求解最大团问题的主流算法,并取得了一些研究成果,但仍存在通用性差、求解效率低等问题。大数据领域下图中节点的海量性和分析的复杂性,对最大团问题的研究在速度和精度上都提出了更高的要求,传统的启发式算法已无法满足针对大规模图数据求解最大团问题的研究需求。为此,本文提出一种新的基于Hadoop的并行图划分框架PPMC求解大规模图例的最大团问题。本文的主要研究工作和创新点包括以下三部分:1)在突破局部搜索算法BLS的基础上进行改进,增加基于惩罚值的penalty_BLS子算法,提出一种新的分阶段PBLS算法求解最大团问题,有效的提高算法的通用性和求解效率。2)提出一种新的PGP并行图划分算法对大规模图例的搜索空间进行划分,在保持原有的团结构不变的情况下,利用节点度排序大幅度减小子图的规模,并且保证子图规模在合适的范围内,以平衡求解最大团时的任务负载。3)将PGP并行图划分算法与分阶段PBLS算法相结合形成一种新的基于Hadoop的并行图划分框架PPMC求解最大团问题,首先利用MapReduce编程模型对图文本进行处理,采用PGP并行图划分算法对最大团问题的搜索空间进行划分,选取分阶段PBLS算法求解各个子图的最大团,最终求得整个图例的最大团。最后,本文将提出的基于Hadoop的并行图划分框架PPMC部署到Hadoop分布式云计算平台上,采用Stanford大规模数据集运行测试,实验结果表明PPMC框架能有效求解大规模图例的最大团问题,在降低搜索的时间和空间复杂度同时进一步提高算法的通用性和可扩展性。
其他文献
海岸蕴藏着丰富的矿产资源,具有巨大的环境价值和经济价值。然而港口、河口、泻湖及海湾通海口严重的淤积问题会给海岸工程的建设带来较大影响,海平面上升以及各种人类活动的
近年来,随着陆地资源的过度消耗,人们开始加大对海洋资源的开采,因此在深海海底铺设了大量的油气输送管道。由于海洋环境的随机性和复杂性,海底管道在地震动作用下的动力响应
当前人们进入了信息化时代,移动通信和互联网在人们的生产和生活中越来越重要。信息化时代需要海量数据的支持,传统的关系型数据库已经逐渐不适应大数据量的存储和管理。在此
“转录组冲击”是指由杂交所诱导的基因表达发生快速遗传突变的现象,关于杂交过程诱导基因表达发生变化程度和变化模式的研究受到越来越多的关注。杂种劣势,与杂种优势相对应
水文模型是对现实世界中复杂水文过程的一种概化,模拟了降雨、汇流、蒸发等一系列水文现象。水文模型的研究是水文水资源科学研究领域中的重要部分,同时也是探究水文规律和模
研究区隧道具有地应力高的地域特点和埋深大的工程特点,施工过程中发生岩爆是该隧道在施工过程中所面临的主要工程地质问题和安全隐患之一,本文结合研究区隧道的工程地质环境和天然地应力场等实际情况,将岩爆预测研究作为本文的主线,对研究区该深埋特长隧道的岩爆问题进行了实例研究,本文的研究成果主要包括以下几个方面:(1)基于区域地质环境,尤其是大地构造格架、地质构造、地震,结合区域地应力场既有研究成果,分析了隧
21世纪是信息技术的时代,随着网络技术的提高,信息技术的发展,计算机科学的进步,信息技术渗透到人们生活中的各处角落,为人们的工作,学习,生活带来了巨大的便利。近年来,互联
一般周期间隙约束的序列模式挖掘是挖掘形如p1[M,N]p2[M,N]p3...pm-1[M,N]pm的频繁模式(M和N分别表示最小和最大间隙且M
目前的互联网发展特点是,PC端互联网度过了高速发展的时期,进入增长缓慢的饱和阶段,而以智能手机与平板电脑等作为终端的移动互联网已进入高速发展时期。云计算是为解决网络
随着世界范围的工业化进程,全球环境恶化和能源短缺愈加严重,开发高效率、低能耗、适用范围广和环境友好型的降污排污技术受到了人们越来越高的重视。研究发现,半导体光催化