基于Hadoop的海量数据存储和计算平台的设计与实现

来源 :武汉理工大学 | 被引量 : 15次 | 上传用户:fjms001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信行业和互联网行业的快速发展,用户在上网过程中产生的数据量以TB级速度增长,企业的海量数据处理和存储面临着严峻的挑战,数据的处理能力和存储能力以成为企业发展需要考虑的一个严峻的问题,分布式计算和云存储的应用能解决这一问题。Hadoop分布式系统以其随机访问、实时读写为大数据提供了存储条件。同时,Hadoop分布式系统之所以备受广大企业的青睐,是因为其处理性能和系统稳定性高、成本低和扩展性强的特点。HBase是Hadoop系统中的子项目,在数据更新和存储上与关系型数据库不同,它同时也继承了Hadoop的优点。HBase提供的接口方便了开发人员的应用。因此,许多大企业都用到了Hadoop分布式系统对海量数据进行处理和存储。本文对通信企业在海量数据处理与存储上遇到的问题进行了分析,设计了系统的总体架构,并实现了其中的主要模块功能。作者的主要工作如下:(1)针对中国电信某分公司提出全省上网日志文件的存储与查询需求进行分析,同时考虑到系统的安全和稳定性的需求,提出了系统的总体架构。并搭建了Hadoop集群的实验环境,为系统的实现提供了良好的支撑。(2)根据每个模块实现的功能将系统的总体架构分为数据采集、数据处理、数据存储和数据呈现四个模块,以及各个模块的功能进行了详细设计。同时,实现了系统的数据处理模块、数据存储模块和数据呈现模块的功能。(3)实现了海量数据存储和计算平台的主要功能模块。数据处理模块主要使用MapReduce程序对数据进行处理,主要对数据进行连接操作。数据存储模块使用三种不同的存储方式进行存储,包括关系型数据库Oracle、Lucene和HBase分布式数据库。数据呈现模块又分为WEB端和Service端,采用WebService的方式实现。WEB端主要是页面的呈现使用了缓存技术。Service端主要是数据的查询,查询出的结果以Json的数据形式传递给前段页面。(4)通过四组不同数量级的数据分别对Oracle、Lucene和HBase存储和查询性能进行了实验分析,同时结合Hadoop的存储能力对实验结果进行了分析。实验结果证实了使用该系统能满足用户提出的需求。
其他文献
陶瓷花鸟画在我国陶瓷装饰史上奄藉七分重要的地位。由于受中国传统文化的影响,它在再现、写实方面与西方绘画有较大的差别。
元朝,中国历史上一个重要的朝代。从元朝时期的历史背景,社会习惯等几个方面来论述元朝的陶瓷文化及其对中国陶瓷文化方面的影响是一个有意义的话题。它揭示了社会历史背景对陶瓷文化的影响,为我们陶瓷文化的研究提供了新思路。  元代青花、釉里红的出现,使我国在瓷器装饰艺术上进入了一个崭新的时代。在陶瓷装饰艺术发展的历史长河中,没有哪一种装饰类型能达到青花瓷那样影响巨大而且流传深远。青花瓷器的真正全盛时期在明代
大力选拔培养优秀年轻干部,既是深化干部人事制度改革的战略举措,也是保证党的事业后继有人和国家长治久安的根本大计。作为培养选拔优秀年轻干部的“源头活水”,选调优秀应
徐国平1964年出生于景德镇,江西省高级工艺美术师,景德镇瓷都画院副院长,中国工艺美术学会会员,景德镇市美术家协会理事,景德镇诗词学会会员。1992年毕业于景德镇陶瓷职工大学美术
陶瓷粉彩人物画是景德镇传统的绘画形式之一。粉彩画是用工整细密的笔法来描绘物象,追求绘画手段的装饰意味。其造型手法上强调写意性的概括、提炼,并主张以神韵、神态的需求为
边值分析是网络性能基准测试序列生成的一种重要方法。本文针对网络基准测试系统的特点,提出网络基准测试模型,并对模型中的实体与 关系进行了抽象和描述;在此基础上分析模型中
目前深部储层钻井完井液的高温稳定性问题突出,无法满足深部潜山高温储层钻井工程及储层保护技术需要。本文以高温无膨润土、无固相储层保护钻井完井液中的抗高温聚合物增粘剂
TFS型交流同步发电动机通过联轴器与拖动电机联结成发电机组,主要用于电机的出厂试验和型式试验用电源。其电机可靠性高,维护少,绕组结实,绝缘可靠,绕组散热效果好。与同类型同步
吴国红景德镇市高级工艺美术师,1970年生于江西丰城,毕业于景德镇陶瓷学院。受父亲影响,自幼喜爱美术绘画,从事陶瓷美术近二十年。系景德镇市陶瓷美术家协会会员,擅长青花分水及综
Google阅读器相信不少人都在使用,笔者就是其中一位,每天咱都会打开Google阅读器查看里面最新的订阅信息.其实你知道吗?Google阅读器中有个彩蛋哦,不晓得你找到了没有?