云存储引擎的设计与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:liongliong491
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的的高速发展和广泛应用,人类活动的每时每刻都会有大量的数据产生并进入计算机系统,我们将这些数据进行存储、分析和挖掘,并基于这些数据来提供各种多样化、个性化的应用和服务,这就是已经到来的云计算时代。云存储作为云计算的延伸和发展,其实质是向用户提供以网络为基础的在线存储服务,在大数据背景下,对海量数据的存储是云计算最基础的要求,当前大多是利用分布式环境来进行组织存储。但随着数据量的爆炸式增长,以及人们对数据要求的提高,当前的分布式架构也面临着高扩展性和高可用性的挑战。本文主要研究并实现了一个分布式文件系统,并基于该系统提供了一个云存储引擎。该系统以HDFS和Ceph为基础,通过将元数据节点(Name Node)进行分布式化的研究,最终提出了一个具有良好扩展性的架构,使得系统理论上具备支撑数亿级别的文件数据存储的能力。同时,通过对一些具有良好可用性系统的调研与分析,提出了一个适合本系统的高可用架构。系统通过使用Libevent+thread pool来提高对网络响应的高并发异步I/O处理,并利用流水线写数据技术来提高网络带宽的利用率。系统中的文件是以块的形式分布在数据服务器节点(Data Node)之中,每个块通过冗余存储在其他数据节点中保存了副本,从而保障了文件的安全性,防止了节点宕机时导致文件丢失。最后,该系统还支持集群新节点的注册和动态增加服务,具有良好的扩展性。本文主要完成的工作有:1、设计并实现了一个分布式文件系统,并基于该系统提供了一套完整的云存储引擎解决方案。2、实现了云存储引擎中文件相关操作模块的功能。3、以HDFS和Ceph文件系统为基础,实现了对分布式系统元数据服务器的扩展性改造,达到了海量文件数据存储的目的。4、在云存储引擎中采用了高可用性的架构设计,保证了分布式文件系统的单点可用性。5、采用冗余存储机制,达到了云存储引擎副本一致性管理的目标。
其他文献
随着我国人民生活水平的提高以及近年来医疗卫生事业的高速发展,各地医疗机构均希望通过扩大院区、引入先进的医疗设备与优秀的医务人才来满足人们日益增长的就医需求。首先,面对当下脱贫攻坚的首要任务,为了改善贫困地区的就医条件,医疗配套是其中的重要环节,而增加基层医疗机构数量是关键,这就使得大型医疗机构开设下属分支机构的过程中会存在资金短缺问题;其次,现有的大多数医疗机构都不同程度的存在老旧过时且需要更新换
生石灰掺入过湿土路基后,其干湿材料的相互混合作用、生石灰的水化吸水作用以及与土拌和过程中引起水份蒸发作用降低了土的含水量。但当路基成型后,路基外部环境湿度增长会导
土壤侵蚀被称为“蠕动的灾难”,是当今社会人类面临的持续性最强的自然灾害,是人们最关注的生态环境问题,闽西宁化县是我国南方丘陵地区水力侵蚀的典型代表之一。本文以宁化
机会网络是一种不需要从源节点到目标节点之间存在完整链路,利用节点移动带来的相遇机会实现通信的自组织网络。由于机会网络中节点是由人类所携带的短距离智能通信设备组成,
目前,在国家审计领域,广大的审计人员的审计方式逐渐由纸质材料审计转向使用计算机进行审计,计算机在审计领域中逐渐显露出其强大的数据分析功效,国家审计署以及各地方审计单
全面建成多层次社会保障体系是党的十九大报告提出的明确目标,医疗保障作为社会保障体系中的一个分支,对民众享有基本医疗保障权利发挥着关键作用。其中“完善统一的城乡居民基本医疗保险制度”更是解决广大非就业人群“病有所医”问题的重点和突破口。城乡居民基本医疗保险制度整合是陕西省基本医疗保险制度体系建设最主要的结构性变革。受长期城乡“二元”结构影响,城镇居民医保和新农合在制度设计上有着诸多问题,使得公民无法
生物炭是一种稳定的富碳产物,通过农林废弃物等生物质在缺氧条件下热裂解形成。在我国北方地区,玉米和小麦作为最经常使用的粮食作物,其秸秆便成为了主要的农业废弃物。这些
借壳上市在我国的发展历史并不算长,却是A股上市公司并购重组最为重要的交易类型之一,广受资本市场各个参与主体的关注。近几年,随着上市公司并购重组交易的迅猛发展,借壳上
随着科学理论的进步与信息技术的发展,经典通信过程中信息安全逐步受到来自窃听者的威胁。量子通信基于量子力学原理可以使得用户之间实现远距离无条件安全的通信过程。量子
南方花岗岩红壤区水土流失严重,通过造林种植了大面积的马尾松,但是林分结构单一缺少其他植被的覆盖,马尾松林地水土流失依然严重。长汀县是马尾松林地水土流失最严重的县份