论文部分内容阅读
随着信息技术的迅猛发展,当今社会已经进入到一个数据爆炸性增长的大数据时代,业务系统中数据规模越来越大。而另一方面,随着数据挖掘和利用能力的急剧增强,数据的价值也在不断上升。因此,对数据安全性的保护越来越重要。如何避免灾难的发生或者在灾难发生后如何快速恢复业务能力,减少业务损失成为学术界、产业界以及各级政府部门重点关注和研究的问题。容灾是信息系统保护的一种重要手段和技术。容灾是指在灾难事故发生时保证业务系统业务连续正常运营的过程。容灾的核心目的是防止业务系统在发生灾难事故时导致系统服务中断和数据丢失。容灾大部分是通过在主系统之外组建和维护一个备份系统,利用地域隔离来确保业务系统的安全性。传统的灾难恢复方法都是通过对数据进行完全的备份和恢复来保障数据的安全可靠。但传统灾备技术在面对海量数据时,由于灾难发生时数据的恢复时间太长,严重影响了业务系统的可用性,往往导致业务长时间中断,带来巨大的损失。针对上述问题,本文在深入分析了传统容灾以及数据摘要相关技术的基础上,以海量数据库系统灾难发生后的快速业务能力恢复为目标,研究了一种面向灾难恢复的数据摘要技术,设计实现了一个分布式数据灾备管理平台。具体工作如下:1.设计了一种快速恢复系统核心业务能力的方案。该方案首先恢复关键业务数据以及摘要数据,实现核心业务能力的快速恢复,然后再恢复其它数据。2.研究设计了一种适合快速灾难恢复的数据摘要方法。提出一种两阶段压缩的数据摘要技术,大大降低了备份数据的规模,同时保留了原始数据的特征模式信息。3.设计实现了一个分布式数据灾备管理平台。其核心功能构建数据摘要子系统对数据进行数据摘要实现高效的数据容灾以及对备份数据进行高可靠性、高效率的存储管理,从而实现高效率的容灾。