论文部分内容阅读
随着信息技术的迅猛发展,信息化程度的不断提高,全球数据量呈现出爆炸式增长。面对当前PB级的海量存储需求,传统的文件系统在容量和性能的扩展上存在瓶颈。云存储以其扩展性强、性价比高、容错性好等优势得到了业界的广泛认同。为了增强系统的可用性和容错性,云存储系统必须采用副本技术。而副本技术的引入也带来了负载均衡、数据一致性等诸多问题的挑战。因此,数据副本管理的研究对云存储系统来说十分重要。目前,关于云存储系统中数据副本管理的理论研究基本上处于初级阶段,因此有很多理论问题值得进一步探讨。合理的数据副本管理策略不仅可以降低远程访问数据时的网络延迟及带宽消耗,还可以提高数据的安全性、可靠性、系统的容错性及负载均衡等。 本文在对云存储环境中数据副本管理机制分析研究的基础上,根据目前副本管理策略研究现状及项目的实际应用,针对副本管理中的副本创建和副本一致性维护这两个方面进行了深入的研究,主要工作包括以下三个方面: 第一,本文提出采用中心服务器模式的云存储系统模型,在分析研究文献的基础上设计出云存储系统下的数据副本管理模型。该模型自上而下依次分为四层:云端用户访问层、访问接口层、副本管理层以及存储层。这个云存储系统模型和副本管理模型为后续的研究奠定了基础。 第二,本文研究基于用户访问频率的动态副本创建和针对节点最轻负载的副本放置策略,将此策略应用于副本创建阶段。该策略利用用户访问频率对热点文件副本进行有针对性的创建,同时充分考虑节点负载情况,对最轻负载的节点进行副本的放置,提高了系统的性能并均衡系统负载。 第三,本文在分析研究网格计算中数据副本管理策略的基础上,设计了针对云存储环境下的改进的副本自适应一致性更新策略,该策略对于不同级别的副本进行不同形式的更新,对主从副本进行实时更新,对其他副本采取基于访问频率的更新,这种针对云存储的改进的自适应一致性更新策略在节省带宽资源的同时也减少了用户访问副本的延迟,提高了云存储系统中文件复制的性能,并达到了负载平衡。 总之,本文重点研究云存储环境下数据副本管理策略,对副本创建和副本一致性维护两个方面进行了深入的研究,并在云计算模拟器CloudSim上进行了实验仿真,实验表明本文提出的策略具有优越性。