【摘 要】
:
PFP_Growth算法是FP_Growth算法在Hadoop平台上基于MapReduce的并行化,该算法在分组过程中没有考虑负载均衡问题,导致各个节点完成任务时间不一致,甚至相差很大,从而降低了算
【机 构】
:
河北工业大学计算机科学与软件学院,河北师范大学信息技术学院
【基金项目】
:
河北省自然科学基金(No.F2016202144,No.F2017202145)
论文部分内容阅读
PFP_Growth算法是FP_Growth算法在Hadoop平台上基于MapReduce的并行化,该算法在分组过程中没有考虑负载均衡问题,导致各个节点完成任务时间不一致,甚至相差很大,从而降低了算法的执行效率。为了提高算法的执行效率,提出了一种基于Spark的RPFP算法,该算法对PFP_Growth算法在均衡分组和降低时间复杂度两方面进行优化,通过把负载大的项放在负载总和最小的组里面实现均衡分组,通过在链头表结构中加入一张哈希表达到快速访问元素地址的目的,从而降低时间复杂度。实验结果表明,RPFP通过
其他文献
本文紧紧围绕新时期特色鲜明的海西区域创新体系的构建,依托福建现有的特点和优势,提出了重点应突出的闽台创新要素的交流互动及共同创新、具有内在创新特质的福建文化、由海
目的:观察舒血宁注射液辅助治疗创伤性蛛网膜下腔出血患者的临床疗效及安全性。方法:将96例创伤性蛛网膜下腔出血患者按随机数字表法分为对照组和观察组,各48例。对照组患者给
针对智能停车库中自动导引运输车(automated guided vehicle,AGV)存取车路径规划问题,提出了一种基于Dijkstra-蚁群算法(Dijkstra-ACO)的泊车系统路径规划方法.首先利用链接
柬埔寨是新中国第一个提供经济技术援助的民族主义国家。这项工作标志着新中国援外对象不再只局限于社会主义国家,转而开始面向广大亚非拉国家。它是亚非会议后中国与亚非拉
多AGV作业是随着产业规模扩大、自动化程度提高、工序增多及柔性增大而逐渐得到越来越广泛的应用。多AGV作业调度问题对提高运输效率能够产生一定的影响,因此对它的研究在丰
森林防火是发展现代林业和建设生态文明的重要保障,本文以江西省都昌县为例,指出森林防火工作中存在林地内外可燃物增加,生物防火带建设滞后、防火监测网建设不健全等问题,提
EPC总承包模式是目前国际上最为流行的大型工程承包方式,该模式在投资成本、工程工期、施工质量等方面相对于传统承包模式有着明显优势。文章介绍了EPC总承包模式的优缺点和
通过回收破片的金相分析研究了LY12铝圆管的剪切断裂现象。回收破片具有典型的剪切断裂特征,断口与径向近似成45°,断口观察发现断口面经历过径向摩擦;从低倍照片看,擦痕条纹
随着我国城市化、工业化步伐的加快,数以亿计的农村剩余劳动力迁移到城市。如何让这些农民工成功融入城市,成为城市的一员,已经成为各个学科研究的热点,很多学者从社会排斥的
韩国是亚洲四小龙中最大的经济体,是全球制造业较为发达的国家之一,韩国制造业门类齐全、独立完整、技术较为先进。但近年来,韩国制造业面临不断崛起的中国制造业以及逐渐复