基于Hadoop与nongoDB整合技术的大数据处理分析

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户：woxiangtoucai

【摘要】

：

【作者】

：

史小英杨浩

【出处】

：

电脑知识与技术

【发表日期】

：

2019年29期

【关键词】

：

数据节点数据处理分片服务器集群

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：在数据类型不断增加，规模逐渐扩大的趋势下，NO SQL技术与MapReduce并行处理理念开始备受关注。而作为N0SQL数据库典型代表，MongoDB可索引并查询大量数据，但是其所提供的MapReduce无法满足太过繁杂的数据分析与并行计算。而Hadoop具备强大的MapReduce计算能力，但实时服务延时较长。对此，可基于扩展性、数据本地化等相关要素分析，整合Hadoop与MongoDB，针对不同应用场景，寻求最优整合方式，以提高大数据处理效率与质量。
　　关键词：Hadoop;MongoDB;整合;大数据处理
　　中图分类号：TP311 文献标识码：A
　　文章编号：1009-3044（2019）29-0001-02
　　1Hadoop与MongoDB概述
　　1.1Hadoop
　　Hadoop包含大量元素，最底部为HDFS，作用是存储所有节点文件，其上层为MapReduce引擎，以及数据仓库Hive、数据库Hbase。Hadoop在大数据处理中实现广泛应用的关键在于，其数据提取、变形、加载等极具优势。Hadoop分布式框架推动大数据处理引擎尽量接近存储，比较适合批处理操作，所以，批处理结果可直接存储。Had oop的Map Reduce功能可碎片化单项任务，并实时传输到各节点，然后以单数据集形式向数据仓库加载。
　　1.2MongoDB
　　MongoDB是针对Web应用程序与互联网基础设施所设计的数据库管理系统，是典型的No SQL数据库。MongoDB以BSON为数据模型结构，其可促使MongoDB在生产环境下提高读写能力，吞吐量明显较强。而且，MongoDB还具备分片能力，可分片数据集，以此将数据存储压力分摊到多台服务器上。MongoDB还可检测主节点的存活状态，在失活的时候，可自动将从节点转变为主节点，以转移故障。由于BSON数据模型主要面向对象，因此可表征十分丰富，层次化分明的数据结构。
　　2Hadoop与MongoDB整合框架
　　Hadoop善于分析计算海量数据，MongoDB擅长分布式存储与查询数据。有机整合可发挥双重优势，同时满足数据分析、计算、查询、存储等多项要求。整合框架具体如图1所示。
　　就Hadoop与MongoDB整合而言，使用了中间件，即Mon-goDB Hadoop Connector，作用是利用MongoDB替换HDFS，作为Map Reduce数据源，在分布式集群中，集合划分为固定形状的块基于MongoDB储存，而Hadoop Mappers以路由节点为载体并行读取块，解析数据，然后利用Reducer合并，传输结果于Mon-goDB。在数据处理中，HDFS并未发挥作用，为保证Hadoop与MongoDB整合的有效性、灵活性，以及数据处理的实效性。就MongoDB Hadoop Connector进行了优化扩展，即在Connector中添加Input Format与Output Format类，以HDFS与MongoDB为Map Reduce可选择输入源或者输出目标。
　　Hadoop与MongoDB整合方案以配置方式不同划分为四类，即：一是基于HDFS读取数据，并编入计算结果;二是基于HDFS读取数据，在MongoDB中编写计算结果;三是基于Mon_goDB读取数据，在HDFS编写计算结果;四是基于MongoDB读取数据，并编入计算结果。针对三种不同应用场合对各方案性能进行评估与测试，即：一是Read=Write，读写大致相同;Read

其他文献

基于MOOC的电气自动化专业教学模式应用研究

摘要：高等教育技术、观念、体制、模式等在MOOC教学并重模式影响下发生了重大变革，体现在学习网络构建、知识创造与分享、开放教育发展等。基于MOOC的电气自动化专业教学模式应用，促进教学信息对等分布、促进教学过程的生动呈现、促进教学过程的多维化，更能够体现电气自动化专业人才培养目标的应用性和技术性，符合培养具有创新能力应用型人才的目标要求。　　关键词：MOOC；电力电子技术；教学模式应用研究；教学过

期刊

电子技术知识点电力项目学生电路

信息技术环境下提升高职院校图书馆编目质量的对策

摘要：要提升高职院校图书馆服务质量与水平，就必须提高编目质量，信息技术的广泛应用为图书馆提高编目质量提供了新的技术手段与服务空间。为提高图书编目质量，我们应加强编目工作标准化建设和编目数据库的维护，加强外包编目数据质量的审核与监管，加强制度建设营造良好编目环境，重视云计算在联机联合编目中的应用。只要认真负责、规范管理，充分运用信息技术手段，高职院校图书馆编目质量就会不断提升。　　关键词：信息技术；

期刊

编目图书馆数据质量工作外包

分层模式下基于SPOC的翻转课堂教学方法研究

摘要：分析了大学计算机基础课程存在的问题，构建了一种新的教学模式，根据学生的计算机能力对学生进行分层教学，实现“因材施教”，借助SPOC平台实施翻转课堂的教学改革，使得学生成为教学的主体，打破传统的以教师为中心的教学模式，结合在线学习和课堂学习的优点，突破课内与课外的限制，使教学和学习空间得到延伸，提高学生的学习积极性和主动性，从而提升教学质量，增强学生的计算机知识和能力。　　关键词：分层教学;S

期刊

学生信息技术课程在线水平知识

基于Python的数据挖掘

摘要：随着大数据时代的到来，商业、政府机构等许多部门和行业都面临着数量越来越多的数据资料，因此数据挖掘受到外界越来越广泛的关注。该文就阳光集团所提供的西南某省的具体数据，基于python语言对其进行数据清洗、数据挖掘以及回归分析。　　关键词：python；数据挖掘；数据清洗；回归分析　　中图分类号：TP391 文献标识码：A 文章编号：1009-3044（2018）23-0015-06　　1 涉及

期刊

数据错误体重就会臀围单位

省卓越校建设背景下智慧校园建设方案研究

摘要：结合湖南汽车工程职业学院在智慧校园建设中的实践，提出了以“物联网大数据分析”为智慧的建设定位；坚持“以人为本、服务为先、流程驱动”的建设思路；以校园泛网络平台、PC端和移动端业务系统、数据采集及存储以及大数据分析和决策辅助为主要建设内容分步实施。　　关键词：智慧校园；物联网；信息化　　中图分类号：TP391 文献标识码：A 文章编号：1009-3044（2018）14-0233-01　　1

期刊

校园智慧数据大数系统湖南

社交媒体对大学生阅读习惯影响的调查分析

摘要：基于传播学与社会心理学，采用问卷调查法，从社交媒体使用情况、阅读现状、基于社交媒体的阅读特征、社交媒体影响阅读的途径等几个方面，调查了大学生基于社交媒体的阅读现状以及社交媒体影响大学生阅读习惯的途径。得出大学生基于社交媒体的阅读通常处于浅阅读状态、阅读时间和内容碎片化、阅读内容娱乐化等结论。根据结论对大学生基于社交媒体的阅读，以及基于社交媒体的阅读内容的设计提出相关建议，以期实现最优化阅读。

期刊

社交媒体受访者如图所示大学生

中职学校计算机应用类课程教学中的“授人以渔”

摘要：该文将以《办公软件综合应用》课程教学为例，阐述教学中如何引入任务驱动教学法，以及该教学法在该门课程教学过程中的实施效果评估。由于整个计算机应用类课程教学的相似之处，《办公软件综合应用》课程的教学方法可起到抛砖引玉的作用，推而广之为此类课程教学可选择的方法。　　关键词：计算机；课程教学；办公软件；任务驱动　　中图分类号：G642 文献标识码：A 文章编号：1009-3044（2018）06-0

期刊

学生教学法办公软件知识课程教学课程

经管专业大数据原理与实践课程建设研究

摘要：经管专业大数据原理与实践课程的设计，应该参照Python语言的特点，以培养基本的科研素质为出发点，设计作业和考核形式与标准。同时结合目前时代背景，比如人工智能、机器学习、大数据、物联网技术等为经管专业的研究生定制个性化的教学模式，使得Python语言课程内容更具有实用价值，培养学生的计算思维和解决实际问题的能力，培养适应产业发展需要的跨学科等复合型人才。该课程建设对于其他语言的教学也具有一定

期刊

数据学生课程研究生能力语言

信息技术与专业教学深度融合

摘要：随着信息技术的迅猛发展，如何将信息技术渗透到教育领域，促进信息技术与专业教学深度融合，从而推动学校教学模式变革、提升实训教学效果则显得尤为重要。该文以长春汽车工业高等专科学校虚拟现实（VR）技术在企业现场管理实训教学中的深度应用为例，通过对课程信息化模式创新、实训教学成效剖析、运行机制建设三个方面进行综合分析，阐述了该项目在实施过程中的工作要点，旨在对同类院校如何将信息技术与专业教学进行深度

期刊

现场企业学生虚拟现实实训信息技术

基于超星学习通的移动学习平台模式的构建与应用

摘要：随着数字化、网络化的快速发展，校园无线网络的全覆盖，传统的教学模式已经不能完全满足当前高职类院校课程教学的需求了，这就使得很多课程的教学需要转换模式。以艺术类高职《计算机应用基础》课程教学为例，基于超星学习通云平台技术，构建该门课程线上和线下交互教学体系，将现有的课程资源和教学资源进行有效的整合，并共享到云端，让学生可以通过手机利用超星学习通实现线上线下课程学习。　　关键词：存在的问题；超星

期刊

超星课程学生艺术类高职内容

基于Hadoop与nongoDB整合技术的大数据处理分析

其他学术论文