基于纠删码的分布式存储系统中编码算法的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:hrwhrw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的不断发展和应用的日渐广泛,传统的客户机/服务器数据存储服务模式已经难以满足用户高性能、高可靠、高可扩展性的海量数据存储要求。在应用需求的推动之下,分布式存储技术得到了快速的发展,为构建新一代的Internet数据存储服务模式铺就了一条新的可行之道。传统的分布式存储系统对数据采用副本管理,这样可以保证数据的可靠性,还可以保证当一部分存储节点发生故障后数据不会丢失。但是,随着存储规模的增大,存储副本带来的冗余量也会随之增大,为了应对大量客户端对某个数据同时进行访问,同一个副本的存储数量还会增加,进一步增加了数据的冗余量,使得分布式存储系统的规模更大。采用纠删码技术,可以将原始数据分块并且编码成不同的编码数据块,然后将这些编码数据块分别存储到不同的存储服务器中。当需要读取数据时,同时从存储服务器中获取编码数据块进行解码运算,计算出原始数据。每个存储服务器不再存储完整数据,而是编码后的一个编码数据块,大小只有原始数据的几分之一,这样不仅可以保证存储数据一定的容错能力,还可以大大减少在具有相同容错能力条件下数据的冗余度。在已有的基于纠删码的分布式存储系统中,一般只采用某种编码算法对数据进行编码。当系统规模发生变化,或者数据的容错参数发生变化时,此时采用固定的编码算法不一定是最优策略。因此一个性能优异的基于纠删码的分布式存储系统可以随着系统规模、运行状态以及数据大小动态的调整使用编码的策略。   本文通过对三种纠删码算法进行研究,以及对它们的性能进行了实验上以及理论上进行的分析,给出了编码算法性能与系统规模之间的关系。主要研究内容包括:⑴系统研究了基于VANDERMONDE矩阵和基于CAUCHY矩阵的RS码算法和TORNADO编码算法的纠删码算法;⑵对基于VANDERMONDE矩阵和基于CAUCHY矩阵的RS码算法和TORNADO编码算法这三种纠删码算法的性能进行了分析。对这三种纠删码算法进行实验分析和理论分析,得出了编码算法与系统规模之间的关系;⑶设计并实现了一个基于纠删码的分布式存储系统DSS,包括系统的体系结构、实现模型、模块间的关系以及主要的交互过程。
其他文献
随着视频电话等多媒体应用的增多和无线通讯设备的推广,在无线Ad Hoc网络上传输多媒体业务具有良好的应用前景。传输多媒体业务需要网络提供服务质量(QoS)保证,要求在网络中
随着图像处理技术迅猛发展,人们能够更好治疗某些疾病以及愈后恢复情况的及时监控,从而使得诊疗水平得到极大的改善。图像计算机系统的建立,可以对眼底很多组织进行定量测量
随着Web服务的发展和网络上的数据量呈几何式的增长,人们认识到将关系数据库和信息检索的技术融合到一起可以给用户提供更高效的信息检索服务。论文讨论了在关系数据库上进行
基于系统工程方法,使用数据挖掘聚类方法,对大学生心理健康做详细的分析和研究。本文阐述了聚类分析算法的发展和应用,应用了聚类分析中常用的距离公式和聚类的准则函数,并对
随着习近平主席“一带一路”战略构想的提出,与此同时,国内电子商务迅猛发展,我国的物流产业也随之进入高速发展期。但是目前物流的组织化程度低、配送路径不佳等直接关系到
在基于构件开发的软件工程 (CBSE)中,许多大型的、复杂的软件系统是在一个基本系统的基础上,通过组装机制将构件插入到基本系统中的。这样的开发模式大大提高了软件的生产效率
人类进入信息社会以后,信息技术迅猛发展,电子商务和电子政务自诞生之日起就发挥了重要作用。如今,电子商务和电子政务的发展方兴未艾,他们的开发框架也在不断地革命和更新。
在网络和数据库飞速发展的今天,数据的查找愈来愈频繁,数据量亦愈来愈大,采用一种有效的结构来处理这些数据也就显得非常的迫切。在数据表示方面,树型结构因具有分支性和层次
ESB平台己被广泛应用于企业信息化集成中,现有的监控系统却未能同步发展,不能同时监控服务层、服务器层和硬件层,不能实现监控规则动态部署机制,且不能对运行异常场景进行实
随着互联网的飞速发展以及各类新型互联网应用的普及,企业与研究机构面临的数据规模已经高速膨胀到了TB级乃至PB级。近些年来,伴随着内存价格的下降,为了进一步提升大数据处