面向分布式图计算的图划分算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:adream_T
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,人们在现实生活中积累了大量的图结构数据,分布式图计算框架通过将大规模图数据划分至多台机器上进行并行处理以获得高效的计算效率。图数据的划分作为分布式计算的基础,划分结果的优劣严重影响着分布式图计算的性能,因此,面向分布式图计算的图划分算法成为学者们研究的热点问题。已有的图划分算法根据划分方式的不同可被分为离线图划分算法和流式图划分算法,其中离线图划分算法划分精度较高,但需要依赖完整的图数据信息进行划分操作,而流式图划分算法仅依赖部分图数据信息进行划分,但划分精度较低。本文针对以上问题对图划分算法进行了深入研究并设计新的图划分算法,使得在基于局部图数据信息的情况下可以得到较高的图划分精度。本文研究主要包括以下两个方面:(1)提出两阶段局部图划分算法。针对已有图划分算法的缺点,本文设计了一种新的图划分思想:局部图划分。该划分思想可基于局部图数据信息进行划分操作,同时在划分过程中至多只需保存单个分区的数据信息,有效的降低了对机器性能的要求,更适合大规模图数据的划分问题。基于该划分思想,本文提出了一种两阶段局部图划分算法。该算法引入模块度的概念以量化每个分区的结构紧密程度,并根据结构的变化将每个分区的划分过程分为两个阶段,在两个阶段中分别采用不同的划分策略进行图划分操作。通过大量的实验结果可以验证该算法在仅基于局部图数据信息的情况下可以取得较好的图划分精度。(2)提出自适应局部图划分算法。针对局部图划分速度较慢的缺陷,本文对局部图划分思想进行改进,由每次划分单个节点改进为每次划分多个节点,有效的提高了划分速度。同时对目前的图划分策略进行总结,并将两种主流的图划分策略基于改进后的局部图划分思想进行形式化表示,通过自适应的方法进行结合。通过实验对比分析,相较于两阶段局部图划分算法,自适应局部图划分算法可以大幅的提高图划分效率;同时在所有对比实验中,自适应局部图划分算法的划分精度要高于目前主流的图划分算法,具有较好的划分效果。
其他文献
目的 检测非小细胞肺癌(non-small-cell lung carcinoma,NSCLC)组织中细胞凋亡抑制因子生存素(Survivin)和细胞周期素D1(CyclinD1)的表达,探讨它们与NSCLC临床病理特征的关系及其在
介绍了马钢苯加氢装置概况及加氢系统换热器堵塞情况,分析了产生堵塞的原因,通过采取控制轻苯原料质量、添加阻聚剂、建立并完善排渣制度、处理预蒸发器及蒸发器残油等措施后
环境污染和能源危机是阻碍现代社会人类发展的两大障碍,主要是因为化石燃料的燃烧既造成环境污染又使得能源日益枯竭。在应对这种挑战的各种技术当中,光催化法和吸附法因高效、廉价、对环境友好等优点被广泛应用。石墨相氮化碳(g-C_3N_4),作为一种非金属半导体光催化剂吸引了广泛关注,由于其狭窄的禁带宽度和热稳定性高的独特性质使得氮化碳在污染物处理、光催化水制氢等领域具有潜在的应用,然而氮化碳比表面积小、光
以往大功率高压脉冲调制器技术多应用于雷达、医用加速器和工业加速器等方面,由于整套系统技术难度大、制造成本较高,限制了该项技术在其它领域中的应用。针对大功率激光器广
我国反垄断法实施多年以来,行政性垄断在我国表现得依旧较为严重和突出,那么我国也就更有理由和必要对其进行法律规制。公平竞争审查的出台和实施意味着公平竞争审查制度已经
背景:转化生长因子-β1受体在多种肿瘤的发生、发展和凋亡过程中发挥重要作用,但其在食管癌中的作用尚未明确。 目的:研究转化生长因子-β1Ⅰ型受体(TβRⅠ)和Ⅱ型受体(TβRⅡ)在
生境-植物-害虫-天敌相互作用关系是果园害虫综合治理的理论基础和研究热点。本研究以苹果园为对象,间作薄荷、藿香蓟、孔雀草和罗勒为处理,以自然生草为对照,研究了苹果园间
高校内部控制与风险管理的主体与客体、过程与要素、职能与目标具有一定的重合性和联系性,但是,重合之处亦有区别。尤其是在组成要素、职能范围与目标体系等方面,高校内部控
目的:探讨原癌基因c-Met及分子CD147在子宫内膜癌中的表达及其与临床病理参数的关系。 方法:采用免疫组化SP法检测原癌基因c-Met及CD147分子在20例增生期子宫内膜、20例分
基因治疗指将外源性遗传物质导入机体靶细胞而治疗疾病的方法。基因治疗载体难以有效的靶向所有肿瘤细胞以及治疗基因难以高水平地表达一直是基因治疗的最大障碍。近年来提出