Hadoop和Spark在实验室中部署与性能评估

来源 :实验室研究与探索 | 被引量 : 0次 | 上传用户：chenzhensheng0

【摘要】

：

随着互联网技术的发展,数据量成爆炸性增长趋势,单机难以存储、组织和分析这些海量数据。面对单机难以处理海量数据的现状,建立分布式计算平台对于今后科研工作和实验教学具

【作者】

：

薛志云何军张丹阳曹维焯

【机构】

：

南京信息工程大学电子与信息工程学院

【出处】

：

实验室研究与探索

【发表日期】

：

2015年11期

【关键词】

：

大数据分布式计算 Hadoop YARN Spark

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的发展,数据量成爆炸性增长趋势,单机难以存储、组织和分析这些海量数据。面对单机难以处理海量数据的现状,建立分布式计算平台对于今后科研工作和实验教学具有重要的意义。就如何在实验室环境下搭建分布式计算平台做了详细说明并对hadoop和spark的性能进行比较,包括Hadoop和Spark集群的安装和部署,Spark集成开发环境的建立,同一组数据集在两个平台上进行Kmeans聚类的时间对比。对于建设分布式计算平台具有一定的指导意义。

其他文献

基于整链视角的芜湖港煤炭物流发展战略研究

煤炭在国家能源构成中的重要占比和资源分布与消费地域的差异,客观上将持久对煤炭物流产生依赖。芜湖港历来是长江煤炭重要输出港,在长江经济带战略、煤炭物流发展、省市区域

学位

港口煤炭物流整链SWOT分析发展战略

新闻英语听力从大一抓起

教育从娃娃抓起,新闻英语听力应从大一抓起。本文从新闻英语的词汇、语法和语篇三方面所呈现的新闻文体特色的角度,提出新闻英语听力突破的技巧。

期刊

大一新生新闻英语听力技巧

对年轻化非酒精性脂肪肝危险因素的浅析

非酒精性脂肪肝(NAFLD)是一种排除酒精性(或无过量饮酒史)和其他已明确原发和继发的疾病诊断对肝脏损伤因素所造成肝细胞脂肪贮积为特征的临床病理综合征[1]。随着人们 Non-

期刊

非酒精性脂肪肝危险因素年轻化病理综合征代谢综合征NAFLD脂肪贮积损伤因素

复方熊胆茵陈颗粒微生物限度检查及控制菌检查方法验证

目的建立复方熊胆茵陈颗粒的微生物限度检查方法,保证检验结果的准确可靠。方法按中国药典方法进行菌回收率试验及控制菌检查方法验证。结果 5种试验回收率试验均为70%以上,

期刊

复方熊胆茵陈颗粒微生物限度控制菌检查

制度视角下的城乡义务教育资源均衡配置探析

随着教育改革的逐步推进,教育公平问题引起公众的广泛关注,城乡义务教育均衡发展成为实现教育公平的根本保证。城乡义务教育资源配置失衡的原因、特征与制度障碍、制度供给不

期刊

制度视角城乡义务教育教育资源均衡配置

以力通神以线达情抒情画心——书法练习对留守儿童个性发展的积极影响

书法练习可以愉悦心情,陶冶情操,调节身心,使人心境恬淡,思维活跃,修养提高,自信增强,而这些恰是农村留守儿童所缺乏的品性。农村留守儿童的人身安全、学习、品德、心理发展

期刊

书法练习留守儿童个性发展

我国汇率制度弹性与货币政策的独立性——基于1994年1月—2011年9月数据的实证研究

使用月度数据实证分析1994年以来我国货币政策的独立性,并探讨2005年汇率制度改革对货币政策独立性的影响可发现:以短期存款利率代表官方利率,以同业拆借利率代表市场利率,分

期刊

汇率制度改革货币政策独立性利率

基于MIV-BP型网络实验的房地产项目风险识别研究

为了更准确更客观地识别房地产项目中的风险,为房地产项目投资决策提供科学依据和参考,有效地规避风险,本研究在BP神经网络(Back-Propagation Neural Network)建模的基础上,

期刊

房地产风险识别MIV-BP网络MIV算法

政府投资、民间投资与城镇化发展——基于PVAR模型的实证分析

基于1997—2012年省级面板数据,运用PVAR模型对城镇化率、政府投资、民间投资进行实证研究,研究结果发现单位民间投资对城镇化的促进作用大于政府投资,同时从长期看,单位民间

期刊

城镇化政府投资民间投资PVAR模型动态关系

妊娠期糖尿病患者血小板参数的临床研究

目的探讨妊娠期糖尿病（GDM）患者的血小板参数的变化。方法回顾性分析2009年1月～2010年8月住院的GDM患者72例患者血小板参数,并选取同期正常妊娠妇女70例作为对照组。结果①妊娠

期刊

妊娠期糖尿病血小板参数Gestational diabetes mellitus Platelet parameters

Hadoop和Spark在实验室中部署与性能评估

与本文相关的学术论文