分布式存储系统中高性能和高可靠性问题的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wangyingygp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术和宽带网络技术的迅猛发展以及存储市场的巨大需求,极大地推动了分布式存储技术的进步,同时也给现有的存储系统不断地提出各种新的要求。对分布式存储系统而言,系统应该能够提供始终如一的、高质量的存储服务,尽量降低由于网络环境的动态性和不可预知性以及热点数据访问等原因对系统服务的可靠性和服务性能所造成的影响。另外,数据的重要性也决定了高可靠性是分布式存储系统的基本目标之一。在信息化程度越来越高的今天,数据丢失已经变得不可忍受,因为一些重要信息的丢失往往会给企业带来巨大的经济损失。因此,如何实现高性能、高可靠的存储服务是当今存储系统中亟待解决的关键问题。   然而,纵观现有的各种分布式存储系统,发现它们在服务性能和可靠性方面仍然存在一些问题,主要表现在:1)目前大多数存储系统普遍存在主服务器性能瓶颈和单点失效问题,由此容易造成系统服务的不可靠和服务性能低下。虽然心跳机制能够在一定程度上降低单点失效发生的可能性,但在系统服务的可用性和服务性能等方面仍然存在着不足之处。2)现有的任务调度算法往往追求单一的调度目标,虽然可以使得加权总完成时间最优,但是在任务的平均周转时间方面考虑不足,并且在某些情况下可能会导致“饥饿”现象。3)现有的大多数副本管理策略主要根据节点对文件的访问频率或者系统总的请求响应时间来选择合适的副本放置节点,缺乏对单个请求的响应时间要求进行考虑,这可能会造成部分用户的请求响应时间过长。4)目前关于存储系统可靠性方面的研究主要是围绕数据冗余方法的研究而展开,而较少关注甚至忽略了存储资源分配方案对系统整体可靠性的影响。现有的存储资源分配方案虽然简单直观,但在文件大小和文件的重要性对系统整体可靠性的影响方面考虑不足。   本文针对现有的存储系统在服务性能和可靠性方面所存在的一些问题,分别从系统服务模型、任务调度算法、副本分发机制以及存储资源分配方案四个方面进行了系统而深入的研究,取得了若干创新性成果。   本文的主要研究工作和创新性成果体现在以下几个方面:   1.针对现有存储系统在服务的可靠性和服务性能等方面存在的不足,首先引入一种动态k叉树结构,给出了动态k叉树的相关定义和算法。然后在此基础上,提出了一种基于系统负载的轮流服务模型--ASSL(Alternate Service based on System Load)。在ASSL模型中,首先采用自回归负载预测模型来预测节点的负载以及过载发生的时间,这样,可以在节点过载发生之前采取主动防范措施(选举新的服务节点),从而提高了系统服务的可用性和服务性能;其次,通过采用基于选举域划分的多机心跳机制方法,减少了节点失效的检测时间和主节点的通信量;最后,为了进一步降低选举开销,对主节点过载和失效两种情形分别采取不同的选举机制。理论分析和实验结果表明,该模型对提高系统服务的可靠性、可用性以及服务性能是有效的。   2.分析了现有任务调度算法MTWCT(Minimize Total Weighted Completion Time)存在的不足,在此基础上提出了一种改进的优化任务调度算法E-TWCT(Enhanced TWCT),并给出了ρ因子的划分规则、△ρ和△t的临界值的设定方法以及E-TWCT算法的调度策略,同时进行了算法复杂度分析。实验结果表明,本文提出的算法不仅能够有效地消除“饥饿”现象,而且能够获得和MTWCT算法相同或者更优的平均周转时间,并且加权总完成时间和MTWCT算法相当。   3.分析了现有副本管理策略存在的不足,根据副本分发方案所需满足的目标要求,建立了一种基于响应时间度量的动态副本分发模型,并设计了求解该模型的遗传算法。实例分析表明,本文求解的副本分发方案RPRTM(Replica Placement based on Response Time Measure)能够在满足各个节点的单个请求的响应时间要求的同时使得系统所需创建的副本数最小化,而且在最大程度上缩短了系统总的请求响应时间,提高了系统整体服务性能。   4.针对现有存储资源分配方案存在的不足,提出了文件优先级比重的概念,充分考虑了文件大小和文件重要性对系统整体可靠性收益的影响。在此基础上,研究了有限资源条件下如何对多个大小不同、重要性不同的文件进行资源分配的问题。建立了一种非线性整数规划模型,求解并得出了能够使得系统整体可靠性收益达到最大的理论最优资源分配方案和可行最优资源分配方案,同时给出了相关的理论推导和证明。实验结果表明,相比现有的资源分配方案而言,本文求解的资源分配方案能够在相同存储资源条件下获得更高的系统可靠性收益。
其他文献
实时监测管理系统是一个软硬件结合以软件为主的分布式应用系统,其目的是管理网络、计算机硬件、机房环境、操作系统、应用支持环境(包括数据库、web服务器等)、以及在上层运
应用偏微分方程(PDE)处理图像是近年来在图像领域兴起的一种新方法。本文对基于PDE模型的图像分解方法进行了研究,这些方法可以将图像分解为主要包含结构信息的同类(Homogeneo
协同设计系统是基于网络的分布式系统,它的运行必须保证合法用户在恰当的任务时间段具备访问数据的能力,非法用户的请求应被阻止,同时还要保证重要的信息在一个群组中以基于
通过计算机断层扫描可以获取一系列包含有缺陷信息的二维断层图像,但需借助工程人员的经验和空间想象来判断缺陷的三维信息,具有很大的局限性。为进一步精确确定缺陷的空间位
模糊系统是处理非精确性和不确定性复杂信息的强有力工具,能有效的将专家经验和观测数据结合在一起,灵活的表达各种非线性关系。模糊系统具有可解释性,它的结构和参数可以用模糊
Web Service是基于网络的、分布式的模块化组件,它执行特定的任务,遵守具体的技术规范,这些规范使得Web Service能与其他兼容的组件进行互操作。Web Service的主要目标是在现
非经典逻辑,特别是模糊逻辑、Rough集理论以及一般蕴涵逻辑都为描述和处理事物的模糊性和系统的不确定性以及智能信息处理和智能计算等提供了十分坚实的理论基础,但是与实际应
随着计算机网络的普及,网络安全问题日益突出,防火墙作为一种行之有效的网络安全机制,已经得到广大用户的认同。  论文首先对防火墙的关键技术及其体系结构进行了介绍,接着对Li
井下作业工程监督是石油行业的工程监督中的重要工作,它是由投资方聘用的派驻施工作业现场的全权代表,对施工方施工的项目进行监督。当前井下作业工程监督的开展面临着两个主要
随着互联网的迅速发展,网络安全问题日益严重,安全威胁事件逐年上升,近年来的增长态势变得尤为迅猛。与此同时,经济利益的驱动和网络攻击技术门槛的降低使得异常流量也呈爆炸式的