Hadoop环境下基于数据本地化的Reduce任务调度策略

来源 :计算机与现代化 | 被引量 : 6次 | 上传用户:yhz8668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在MapReduce模型任务处理过程中,当Reduce任务开始执行,远程拉取Map阶段的输出数据时,会消耗大量的网络带宽,甚至会出现网络瓶颈问题。本文提出基于数据本地化和负载均衡的任务分配策略。该策略中用户首先设置采样数据量M,在Map阶段对前M个数据块进行采样;其次根据采样结果,同时考虑数据本地化因素,将Reduce任务进行分配;然后基于负载均衡将Reduce任务进行再分配,通过任务分配,系统生成一个任务分配表;最后启动Reduce任务,系统开始数据拉取,未被采样的数据根据任务分配表进行任务分配。
其他文献
通过对信道接入协议及退避算法的原理进行研究,针对无线网络的挑战和问题,本文提出基于RBF神经网络的无线信道退避算法的优化设计。该优化设计主要根据网络的整体情况,合理地调
目的探讨新疆哈萨克族(哈族)冠心病患者外周血单核细胞Toll样受体4(Toll-like Receptor4,TLR4)表达及与临床意义。方法根据冠状动脉造影结果及患者既往心脏病史,选取67例哈族冠心
目的通过观察药物联合(福辛普利钠联合曲美他嗪)治疗充血性心力衰竭(CHF)患者血浆B型钠尿肽(BNP)水平变化及临床疗效,探讨其临床价值。方法采用福辛普利钠联合曲美他嗪治疗107例CHF
目的观察山莨菪碱、普鲁卡因联合氟尿嘧啶治疗恶性胸腔积液的疗效和不良反应。方法 20例恶性胸腔积液患者随机分为观察组和对照组,两组抽尽胸腔积液后,观察组胸腔注入山莨菪
为落实“立德树人”根本任务,达成核心素养发展目标,实现育人模式的根本性转变,我校深入课堂研究,在学科内部以及学科间展开了项目式的学习活动。本文主要以“未来学校设计”
经外周静脉置入中心静脉导管(PICC)作为中长期输液导管,因具有置管成功率高、留置时间长、安全系数高、并发症少等特点,近年已被广泛应用于临床,且PICC置管已成为老年危重患
自宋至清,苏轼诗集有多种注本,这些注本大致可以分为分类注和编年注两大类。在历史的流变中,这两大苏诗注本系统既各自独立,同时又有交织和融合。有关后注对前注的继承和删削问题
目的观察辛伐他汀对慢性心力衰竭患者血浆N-末端脑钠肽前体(NT-proBNP)及心功能的影响。方法将60例慢性心力衰竭(心衰)患者随机分为观察组和对照组,均给予常规抗心衰治疗,观察组
大间隔近邻算法(Large Margin Nearest Neighbor,LMNN)具有较强学习能力和泛化能力,在分类领域有广泛的应用。但将其用于大规模文本分类问题时,LMNN算法中的半定规划问题规模会
为更好地发挥公共图书馆政府决策信息服务功能,浙江图书馆今年启动了厅局级机关分馆建设,首家分馆即省财政厅分馆建成启用。目前,由浙江图书馆提供的首批5 6 3册新书已到位,