云存储系统中数据分布研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:logan_lxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络及物联网的快速发展,个体及社会应用产生的数据呈指数增长,海量数据的存储需求日益强烈。传统的存储模式无法应对海量数据存储需求的容量可扩展性、数据可靠性以及高性能,云存储系统在这种背景下应运而生。云存储系统采用分布式文件系统等技术将不同的存储设备通过网络连接的方式汇集成一个资源池,统一提供存储服务,具有高可扩展性、高可靠性等优点。现有的面向云存储的分布式文件系统有很多种,Ceph分布式文件系统以其开源性、提供统一存储能力的特点在企业和科研领域得到广泛关注。  数据分布策略是分布式文件系统中关键技术,其决定了数据存储位置以及系统的负载均衡和容错性。CRUSH算法是Ceph分布式文件系统中的伪随机数据分布算法,可以在异构的大规模层级结构化存储集群中高效地分布数据对象及其副本。然而,CRUSH算法在存储节点负载均衡的设计上存在不足,并没有把底层网络状况和节点负载考虑在内,当存储节点的网络情况恶化后比如集群内部进行数据迁移会占用大量的网络带宽而目前系统中数据选择存储位置仅仅是以节点的存储容量作为权重因子,这使得集群的性能明显下降,降低系统的读写性能。因此,在CRUSH算法中加入网络状态和节点负载的测量对提高负载均衡性具有非常重要的作用。传统的网络架构中,获取网络状态需要繁琐的配置和大量的测量开销,软件定义网络作为新型网络架构采用控制平面和数据平面相分离,通过集中化的控制平面,SDN简化了网络测量和管理并提供灵活、高效的维护策略,因此论文采用SDN技术完成对网络和节点负载的监测。改进后的CRUSH算法结合SDN技术能综合考虑网络和主机负载信息,设计出合理的数据分布策略。论文的主要创新性工作总结如下:  (1)针对CRUSH算法中权重因子只以存储容量作为约束条件导致的存储节点负载不均衡问题,提出改进的CRUSH算法,在节点权重因子中添加网络状态和负载的因素,权重因子的确定具有更细的粒度。  (2)在获取节点网络状态和负载状态问题上,设计软件定义网络和Ceph分布式文件系统结合的架构,通过对SDN控制器进行应用开发,提出主被动相结合的测量方式分别测量存储节点网络状态和负载状态。  论文通过大量的实验对提出的解决方案进行测试,测试结果表明设计的SDN监测应用能准确获取需要的数据信息,通过与现有的CRUSH算法相比,改进的CRUSH算法减少了调整权重引起的数据迁移量,在系统性能方面保持相同的写操作吞吐量的同时对读操作的吞吐量有明显的提升,同时降低了读写操作响应时间。
其他文献
近年来,无线通信技术在全球得到快速的发展,特别是近期4G(第四代移动通信技术)也已经开始投入商用。协作通信技术可以克服无线通信技术中多径衰落的影响,极大的改善系统性能,一直是
物联网从提出到现在已经逐渐应用到人们工作生活的方方面面,智能信息服务是人们亟需的一种服务,也是当前物联网技术应用的一个重要研究方向。然而,随着物联网应用的不断推广,数以
本文主要研究对环肋可展开天线结构的实际测量,由于天线尺寸比较大,由轻质柔性材料制作,且容易变形,考虑采用非接触式测量。本文综合运用计算机视觉、摄影测量学和图像处理等前沿
信息化是我国制定长期发展战略的第一选择。当前的信息化进程存在以PC为代表的知识门槛高、价格门槛高、功耗高、资源利用率等问题。建立的云数据中心大都存在资源利用率相对
离群点检测是数据挖掘和数据管理领域中一个非常重要的研究问题,其主要目标是从复杂数据环境中快速准确地检测出数据中不符合正常(期望)行为的离群点数据,为用户深入分析和理解数
滑坡灾害是我国经常发生的地质灾害之一。对高边坡进行长期的形变监测,分析其变形信息,研究边坡的形变规律和方向,实现对滑坡灾害监测,减少财产损失,避免人员伤亡,成为我国乃至全世
人们的室内活动逐渐增多,据统计人们大约有80%的时间是待在室内的[1]。而传统的GPS(Global Positioning System)、北斗等卫星定位无法完成室内位置服务,基于室内位置服务需求,室内
光传输网是电力通信网的骨干网络,也是保障电网安全、稳定、经济运行的重要基础设施。完善传输网运行质量指标体系,提升评估指标的实用性,有助于提高电力通信网的效率。据此,论文以电力通信光传输网为研究重点,展开运行质量评估的研究工作。论文分析了目前国内外在通信网运行质量评估方面的研究成果,吸收运行质量评估方面的经验,结合电力通信的特点,确立了运行质量指标体系的基本框架,并采用可拓学评价模型和数据包络分析法
自由空间光(Free-space Optical,FSO)通信所具有的通信速率高、发散角小、保密性强等优点,使之成为了近年来的一个研究热点。其被《时代》杂志选为21世纪最有应用前景的技术之一
电力通信网是为了保证电力系统的安全稳定运行应运而生的,专门服务于电力系统运行的通信专网。电力通信网是电网二次系统的重要组成部分,它的基础是电力通信传输网。作为电力通信网的骨干和主要生产、调度、经营及管理类业务的载体,传输网能否安全、稳定运行与整个电力系统运行的稳定性和可靠性息息相关,因此对电力通信传输网的可靠性进行研究和分析,对提升电网的可靠性、预防潜在风险具有十分重要的现实意义。本文在对现有的可