分布式存储中基于纠删码的数据容错技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：aoyun2000

【摘要】

：

大规模分布式存储为现代的商业计算、科学计算等应用提供底层的数据存取服务,已经成为现代社会的信息基础设施。随着数据规模的急剧膨胀,现代分布式存储系统中节点的规模往往

【作者】

：

孙伟东

【出处】

：

国防科学技术大学

【发表日期】

：

2015年期

【关键词】

：

分布式存储容错纠删码并行编码修复数据分块

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大规模分布式存储为现代的商业计算、科学计算等应用提供底层的数据存取服务,已经成为现代社会的信息基础设施。随着数据规模的急剧膨胀,现代分布式存储系统中节点的规模往往达到百万级以上,数据的规模也达到PB级甚至EB级。数据失效已经成为大规模存储系统常态化的行为,因此如何提高容错能力已经成为分布式存储系统所面临的严峻挑战。分布式存储主要通过数据冗余提高数据的容错能力。常用的容错技术包括基于复制的容错技术和基于纠删码的容错技术。基于复制的容错技术通过为每个数据对象创建多个副本来提高容错性,存储开销巨大,难以适应大数据时代的数据规模。基于纠删码的容错技术能够在保持相同容错能力的基础上,极大地降低存储开销,成为当前分布式存储领域研究的热点。基于纠删码的容错技术面临的主要挑战在于:(1)现有的串行编解码方法效率较低,极大的阻碍了纠删码在分布式存储中的应用;(2)在有数据块失效的情况下,数据的读取效率急剧下降,难以满足用户的数据访问请求;(3)修复失效数据块时需要传输大量的数据,修复成本高。本文围绕上述挑战,针对基于纠删码的容错技术进行了深入研究。目前已有的纠删码串行编解码方法在单个CPU核上因伽罗瓦域上的计算开销较大导致其编解码效率较低,并行化技术是提高编解码效率的一种重要方法。但是目前已有的并行编解码方法则存在如下问题:(1)局限于特定的硬件平台或者某种特殊的纠删码方法导致其适用范围有限、通用性较差;(2)并行化时没有深入分析纠删码的编解码特点以及数据读写的I/O特性导致并行化的效率不高;(3)采用系统默认的线程调度策略导致线程切换开销较大。针对上述问题,提出了一种面向多核平台的通用并行编解码方法ParaErasure。在ParaErasure方法中,首先对并行编解码过程进行分析建模,提出了一种能够适用于所有纠删码的通用多线程并行编解码模型MTPErasure;其次在MTPErasure的基础上针对不同的I/O环境分别提出了两种不同的并行编解码算法。针对高速I/O环境下数据吞吐量大导致不同线程之间的数据同步开销相对较大的特点,提出了一种基于静态数据划分的并行编解码算法sdaParallel。该算法采用静态数据划分的方法,将需要编解码的数据对象静态地划分成若干更小的数据对象,再为每个小数据对象分配一个单独的线程实现数据的读取、编解码以及写入过程,以降低高速I/O环境下线程之间的数据同步开销并提高编解码效率;针对低速I/O环境下数据吞吐量小导致线程切换的开销相对较大的特点,提出了一种基于动态数据划分的并行编解码算法ddaParallel。该算法采用动态数据划分的方法,将需要编解码的数据对象按照编解码的基本单位划分成条,由两个单独的I/O线程分别执行数据条的读取和写入,由多个编解码线程动态地对读写就绪的数据条执行编解码过程,以降低线程切换开销并提高编解码效率。在paraerasure方法中,提出了一个独占式的线程调度算法使得编解码线程可以在一个cpu核上运行尽可能多的时间从而降低线程切换开销。实验结果表明,与目前已有的串行编解码方法相比,paraerasure方法在低速i/o环境下的加速比达到1.3倍以上,在高速i/o环境下的加速比达到5倍以上,显著提升了纠删码的编解码效率。目前已有的数据分块方法把原始数据对象简单地分割成若干个大小相等的数据块,因此地址连续的数据条被分配到同一个数据块,导致在数据块失效情况下执行数据读取操作时,需要从多个节点读取大量的数据以解码修复得到用户请求的数据,带来较大的网络传输开销和解码计算开销,影响数据读取效率。针对已有分块方法存在的上述开销较大且效率较低的问题,提出了一种基于条映射的离散数据分块方法d-dividing。d-dividing方法按照编解码的基本单位将数据对象分割成大量的数据条,然后依据映射的方式对数据条进行分组,以完成数据的分块过程。d-dividing方法在对数据条进行映射时,为了最小化分块以后数据读取操作的网络开销和计算开销,以降低数据块失效情况下数据读取时的数据传输总量和解码计算量为目标,把在原始数据对象中位置连续的数据条离散地映射给不同的数据块。在数据块失效的情况下,d-dividing方法使得数据读取过程中每一次解码计算均能够获得用户请求的若干个地址连续的数据条,而在传统分块方法中每次解码计算往往只能得到一个用户请求的数据条。因此,d-dividing方法能够降低数据读取时的网络传输开销,同时减少解码计算的次数,提高数据读取的效率。实验结果表明,与目前已有的数据分块方法相比,当有超过2个数据块失效时,d-dividing方法降低了50%的数据传输总量,减少了40%的解码计算次数,提升了约1倍的数据读取效率。针对目前已有的多节点并行修复方法因链路竞争导致成功修复概率和数据可用性均较低的问题,提出了一种基于分组迭代的多节点并行修复方法gimpr。gimpr方法把对多个失效节点的修复转化成一个可以迭代执行的循环过程,每一次迭代循环被分成三个步骤:(1)从所有失效节点中选择部分失效节点组成一个可以并行修复的分组。为了提高分组内失效节点的数量以增加修复的并行度,提出了一种基于贪心策略的分组构建算法gsgc,该算法按照属于不同数据对象的失效节点优先的方式,不断地把提供节点集合互不相交的失效节点加入到分组中,直到分组中节点的数量达到最大;(2)为分组中的每个节点构建修复拓扑。为了降低分组中每个失效节点的修复开销,提出了一种基于生成树的自适应修复拓扑构建算法artc。artc算法把尽可能多的提供节点包含到修复拓扑中以减小数据传输总量;(3)对分组中的所有失效节点并行地执行修复。修复时采用再生码技术,让修复需要的数据沿着树型结构的修复拓扑从叶节点向根节点传输,并在中间节点进行编码合并以减小网络开销。一个分组中的所有节点完成修复以后,进入下一次迭代循环,此时已经完成修复的分组中的提供节点和替代节点均可以作为尚未完成修复的分组中的失效节点的提供节点以减小数据传输量。实验结果表明,与目前已有的并行修复方法相比,GIMPR方法能够提高成功修复概率30%以上,提升数据可用性30%以上,提升修复效率达到50%以上。

其他文献

叙事护理对脑卒中后抑郁患者的影响

目的探讨叙事护理对于脑卒中后抑郁(PSD)患者住院期间抑郁状态的影响效果。方法选择2016年1月至2017年12月在我院神经内科住院治疗的PSD患者100例,随机等分为对照组和观察组,

期刊

叙事护理脑卒中卒中后抑郁

高职院校体育课程改革的后现代主义审视

高校体育改革是当前我国体育教育的长期课题之一.本文从后现代主义角度重新审视前人对高等体育教学课程改革的研究现状,结合高职院校体育教学现实状况,论述高职院校体育教学

期刊

高职院校体育课程改革后现代主义

浅谈中等职业教育就业质量问题

本文就中等职业学校就业质量不高的问题做了初步的分析,针对原因在微观上提了几点对策建议。

期刊

职业教育就业质量提高

孟加拉初级阶段学生汉字书写调查与教学方法

孟加拉学生属于非汉字文化圈的学习者,对他们来说,汉字学习是汉语学习中的一大难点,因而考察汉字书写错误对提高孟加拉汉字教学质量有一定的意义。本文考察的对象主要是孟加

学位

孟加拉学生初级阶段汉字书写错误教学策略

产业新旧动能转换助推高质量发展

当前我国经济处于传统增长动能衰减和转向高质量发展“双碰头”阶段，迫切需要通过产业新旧动能转换加快产业转型升级，助力经济中高速增长和高质量发展。$$衡量产业新动能形成的

报纸

抓实“五项措施” 加强基层党支部标准化建设

今年以来，四川映秀湾电厂党委围绕国家电网有限公司党的建设“旗帜领航·三年登高”计划对标管理年目标任务，坚持和加强党的全面领导，通过抓实“五项措施”，全面实施党支部组织建

报纸

宽频磁耦合谐振式无线电能传输系统特性分析

首先建立电路模型,结合互感计算,对磁耦合谐振式无线电能传输特性进行建模和仿真分析,研究发射线圈和接收线圈电感值的选择对系统传输特性的影响,建立传输距离、谐振频率与负

期刊

无线电能传输磁耦合电路理论传输特性功率放大系统

中水处理对植物叶片质膜透性及丙二醛含量的影响

本文研究中水处理对三角梅和凤凰木叶片质膜透性及丙二醛含量的影响。结果表明:三角梅叶相对电导率经50%浓度中水处理后达最高,而经100%浓度处理后,其相对电导率却略低对照;

期刊

三角梅凤凰木中水相对电导率丙二醛

21世纪课程目标:向后现代教育过渡

后现代教育作为一种教育理论 ,具有“全民教育”、“终身教育”、“主体教育”、“通识教育”等本质特征。 2 1世纪基础教育的课程目标建设在共识的课程观的基础上 ,应该更加

期刊

后工业社会课程目标现代教育后现代教育

分布式存储中基于纠删码的数据容错技术研究

其他学术论文