论文部分内容阅读
容灾是在应用系统遭遇突发灾难,例如地震、火灾、水灾等情况下,保证数据安全,保障业务连续性最主要的手段。传统的容灾系统由一个生产中心和一个容灾中心组成,当生产中心遭遇灾难时,可由容灾中心对其数据和业务进行恢复。然而,当容灾系统遭遇连续灾难而导致生产中心和容灾中心都被破坏时,该容灾系统显然已经不能继续保障数据安全。本文在学习、分析和比较国内外主流容灾系统的优缺点之后,在传统容灾模型的基础上,设计并实现了基于分布式架构的容灾系统。本文的主要工作总结如下:(1)设计并实现一个1+1+N式架构的分布式容灾系统OsnDDR,该容灾系统包括一个生产中心,一个控制中心和N个容灾中心,可保证在系统多节点损坏情况下用户数据的安全性。(2)提出基于RS纠删码的PRS算法,以实现分布式架构中的数据冗余,并尽可能降低因数据冗余而带来的存储资源消耗。此外,由于RS纠删码编码译码操作的实现基于伽罗瓦域(Galois Field)内多项式运算,因此本文设计双表查找法优化伽罗瓦域内基本运算,并提出RS纠删码的并行化实现方法。实验证明,RS纠删码编码的并行化实现较串行化实现有很大程度上的性能提升。(3)构建容灾中心的性能模型以及负载模型,并依此提出OsnDDR分布式容灾系统的负载均衡策略,以保证系统运行时各个容灾中心的负载均衡。(4)搭建实验平台,并对OsnDDR分布式容灾系统进行实验测试。其测试内容包括OsnDDR对用户应用程序的影响,RS纠删码编码时间等。(5)对在研究与实现OsnDDR分布式容灾系统上所做的主要工作和贡献进行了总结,并提出了对OsnDDR分布式容灾系统未来工作的一些展望。