基于Hadoop的多关键字排序方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:listandmap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在单机环境下按多关键字对大数据排序需要较长的执行时间,为了提高按多关键字对大数据排序的效率,根据Hadoop的MapReduce模型,给出了两种基于Hadoop的多关键字排序方法。方法一在Reduce函数中使用链式基数排序算法按多关键字对大数据并行排序,利用多个节点的计算能力提高排序的效率。方法二通过定义组合键和比较器实现了对记录的多个关键字按字节比较,节省了将字节流反序列化为对象的时间。通过实验测试了两种方法的性能,实验结果表明,两种方法均能取得较高的排序效率和较好的可扩展性。
其他文献
2006年,新《公司法》、新《证券法》的实施及股权分置改革的基本完成给我国的公司治理提供了较为完善外部环境。但还远远难以满足现行公司治理结构的需求。在实际运作中,上市公
高职教育是以培养社会实用型专业人才为主的,这其中学生的实习实训环节是提高高职学生社会实践能力的重要途径。本文基于当前高职学生实习实训质量评价所存在的问题,结合科学
在综合前人研究的基础上 ,结合自己的研究成果 ,系统地阐述了磁处理 (如磁场、磁化水、磁改良剂等 )对土壤微生物、酶活性以及种子萌发和植物生长的影响 ,并对土壤—植物系统
随着科学技术的飞速发展,计算机性能的提高,信息技术在教学中的应用越来越广泛。信息技术与高中语文新课程教学的整合是大势所趋,人心所向。教师要全身心融入信息技术与语文
散文化小说作为一种新兴亚文类,它的成长历经半个多世纪,成熟于二十世纪八十年代。本文从源与流入手,探讨了与之相关的诸多问题,本论文从宏观上把握“散文化小说”这一亚文类,本着
采掘行业是指发现和移动位于地表或地下的石油天然气等递耗性矿产资源的行业,该行业具有高风险、长跨度、资金密集、会计业务复杂等特点,这些特点主要体现在其上游活动,即勘探、
H.264是由国际电信联盟(ITU)和国际标准化组织(ISO)联合成立的联合视频专家组(JVT,Joint Video Team)于2003年5月正式推出的视频编码标准。与以往的视频编码标准相同,H.264采用
在黄土高原子午岭次生林区,对山杨林、白桦林、油松林和辽东栎林四种林分的群落多样性、土壤水分和养分特征、细根分布特征、生物量及其相互关系进行了研究,结果表明:(1)子午
在对比不同国家和地区收入准则的基础上,针对不同国家收入准则差异对跨国企业财务报表损益产生影响的问题,基于跨企业A公司欧洲及拉美子公司的收入数据,编制不同收入准则下的
在当今工程施工过程中,混凝土的作用十分巨大,尤其是在复杂的地质地理环境下,采用混凝土作为主要材料对于工程的质量来说是一个重要保证。笔者结合实际项目工程,通过对冲孔灌