论文部分内容阅读
随着信息社会的发展,互联网发展迎来爆炸时代,数据量增长加快。传统的集中式数据存储技术由于受到设备能力的限制,已经无法适用于目前的情况。分布式存储系统以其良好的可扩展性,健壮性和高效性超越了传统的集中式存储技术。目前的数据存储多考虑存取效率、存储花费,对数据抗毁性研究甚少,如何使得分布式数据存储系统具备优良的鲁棒性是当今面临的挑战之一。本文首先对分布式数据存储系统进行介绍,并分别介绍其两个具体表现:云存储系统和对等(P2P)存储系统。接着介绍了分布式数据存储系统数据存储方法和一致性维护方法,分别对其相关研究进行分类,提出分类标准并对相关研究方法详细剖析,分析其适用场景和面临的挑战。针对分布式数据存储系统数据存储和数据抗毁性研究,我们做了以下两部分具体实现:针对分布式数据存储系统数据存储方法方面,考虑到数据泄露问题已经是目前数据存储系统面临的最大挑战之一,本文提出一个考虑数据存取效率和安全性的数据存储方法。提出安全距离的概念不仅保证了数据的安全性,而且考虑到了不同用户群体对于数据安全的侧重性。接着为了最小化数据存取时间,本文提出一个数据存取节点选择算法,在保证数据安全性的同时最小化数据存取时间。仿真证明相比目前的几种数据存储算法,在保证数据安全性的同时,本文提出的算法在数据存取时间方面小于目前的数据存储算法。针对分布式数据存储系统数据一致性维护方面,为了解决由于网络动荡和网络打击引起的丢包问题,本文提出一个可调节且可靠的一致性维护方法(ARCOM)。ARCOM通过构造更新分发环(mUD-Ring)来传播更新。mUD-Ring运用以下四种方法提高一致性维护效率:多次询问方案避免丢包产生、多点传输可以达到更高的更新传播效率、发送更新前询问可以减少数据冗余、在节点中开辟缓存区能够避免更新丢失。考虑到节点打击和链路损坏,本文提出一个低花费的恢复策略并且对其作了理论分析。Omnet++仿真表明ARCOM与现有一致性维护方法相比有着高的更新传播效率、低的丢包率(近乎为0,其他方法在15%-80%之间)、低的数据冗余。