异构存储系统中的缓存技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：schoolnowl

【摘要】

：

数据的爆炸式增长使得当前的存储系统规模越来越庞大。而云计算、云存储和大数据等新技术不断的出现，也对存储系统的容量、性能等方面提出了更高的要求。当前数据中心广泛使用

【作者】

：

李勇

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2014年期

【关键词】

：

异构存储系统缓存性能 Caper算法云存储服务质量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据的爆炸式增长使得当前的存储系统规模越来越庞大。而云计算、云存储和大数据等新技术不断的出现，也对存储系统的容量、性能等方面提出了更高的要求。当前数据中心广泛使用异构存储设备构建大规模存储系统，以满足存储容量和性能需求的不断增加。如何构建大规模异构存储系统面临诸多问题，其中一个典型问题是由于设备负载和服务能力不匹配，使得存储系统中广泛使用的条带等并行访问技术难以充分发挥作用，导致性能降低。同时，随着云存储等技术的发展，不同应用共享异构存储系统越来越普遍，如何为这些应用提供服务质量保证或者服务公平性非常重要，而存储系统异构性更是对解决这一问题提出了更高的挑战。通过研究异构存储系统中的缓存算法，解决异构存储系统中的性能优化和服务质量保证等问题，主要内容包括以下几个方面。　　针对异构存储系统的设备负载和服务能力不匹配所导致的性能降低问题，提出了一种基于负载特征识别和访问性能预测的缓存算法（Caper）。Caper算法的主要思想是通过优化缓存调度来平衡I/O请求在异构存储设备上的性能差异，减少甚至消除性能最差的存储设备在异构存储系统中性能瓶颈问题。Caper算法采用缓存分区策略，为了合理设置缓存分区的大小，Caper算法用CART模型预测I/O请求在存储设备上的性能，并结合性能预测结果分析不同访问特征负载的缓存需求。此外，Caper算法还改进时钟缓存替换算法以进一步提高缓存效益。实验结果表明，和Clock算法、Forney算法以及Chakraborty算法相比，Caper算法在不同类型的负载访问下均能够获得比较明显的性能提升。　　为应用提供服务质量保证一直都是共享存储系统中的重要研究内容。然而，当不同应用共享缓存时，不同I/O请求到达率的应用之间相互影响程度不一样。在传统缓存算法（如LRU算法）中，和I/O请求到达率较高的应用相比，I/O请求到达率较低的应用获得的缓存资源比较少，从而造成I/O请求到达率较低的应用的服务质量难以保证。针对不同I/O请求到达率的应用共享缓存时存在的上述问题，提出了一种服务质量保证的缓存算法（Qaca）。Qaca算法采用开始时间公平队列控制I/O请求的服务顺序，并采用基于反馈结构的缓存管理策略动态调整应用之间的缓存分配。算法周期性地跟踪应用的服务质量保证程度，计算已满足服务质量保证的应用的富余缓存，然后将这些富余缓存分配给未达到服务质量保证的应用，以保证更多应用的服务质量。在执行缓存分配时，Qaca算法根据富余缓存是否充足采用性能优先或者服务质量优先的缓存分配策略。实验结果表明，和LRU算法和Static算法相比，Qaca算法能够以较小的性能牺牲获得较大程度的服务质量保证，甚至有可能同时获得少量的性能提升。　　在不同I/O请求到达率的应用共享缓存时，传统的预取算法存在较多的预取浪费和预取缓存污染，从而导致性能降低。特别是I/O请求到达率较低的应用，其预取缓存命中率的降低程度要远远高于I/O请求到达率较高的应用，从而使得性能降低呈现不公平性。针对不同应用在共享预取缓存中存在的上述问题，本文提出了一种优化性能和兼顾公平性的预取算法Fepa。为了减少因应用的I/O请求到达率差异造成的预取浪费和预取缓存污染，提出了一种基于I/O请求到达率的预取长度动态调整策略，提高缓存效益和整体性能。此外，Fepa算法分别为每个应用计算最小缓存需求，以避免一个应用发生预取缓存缺失，同时还能够让其它应用分配到更多的缓存，从而提高缓存分配公平性。并以最小缓存需求计算为基础，提出一种基于轮询方法的缓存分配策略，在公平性和整体性能之间取得较好的平衡。实验表明，和LRU算法、Linux内核自带的预取算法以及AMP预取算法相比，Fepa算法在性能和公平性方面都有较好的效果。

其他文献

SDH网络中的多任务多播路由算法的研究与实现

同步数字体系SDH(SynchronousDigitalHierarchy)，是指由若干SDH网元组成，并在光纤或者无线媒介上进行同步数据信息传输、复用、分插和交叉连接的网络。我国现在使用的广电传输

学位

多播路由算法遗传算法蚂蚁算法同步数字体系资源分配

实时分布仿真环境研究——实时分布仿真环境下运行支撑框架的研究与实现

本文对实时分布仿真环境及其运行支撑框架展开了研究,主要研究工作如下:1.分析了实时分布仿真系统的特点,研究了实时分布仿真环境在构造实时分布仿真系统的作用,并对分布交互

学位

实时网络分布仿真共享内存面向对象软件复用

视图发布过程中信息泄漏问题的研究

视图发布是数据交换的主要手段，视图发布为数据交换提供了方便，但在视图发布过程中有可能造成信息的泄漏，因此，保证发布视图的安全成为数据库安全的一个新课题。本文对国内外关于

学位

视图发布数据交换安全信息推理方式信息泄漏测量消除算法

基于跨模态关联分析的多媒体检索与标注方法研究

随着互联网与多媒体技术的发展，互联网上的多媒体数据得到了飞速增长。网络上的多媒体数据通常呈现多模态的特征，在社交网络上共享的图像、视频等媒体数据通常附有相当数量的文

学位

图像标注半监督学习跨模态关联多媒体数据信息检索

防火墙冗余协议的设计与实现

防火墙作为保护内部网络不受外部入侵和破坏的网络安全设备，已被人们广泛地接受，但防火墙一般安装在内部网络和不可信任网络的临界点，是内外网络所有往来流量的集中地。一旦防火

学位

防火墙冗余配置协议路由模式网桥模式高可用性功能

一个广告采编与信息发布管理系统

随着信息社会的到来，传统的广告形式已经不能满足人们获取信息的需要。车载无线文字广告是一种新的广告形式，它利用无线发射设备将代理商的广告发布到车载无线接收看板上并显示

学位

数据库应用系统多层分布式广告信息管理系统

IPv4 over IPv6隧道系统的研究与实现

IPv6协议为克服现有IPv4协议的诸多不足而诞生，但从IPv4到IPv6的过渡是一个漫长的过程，如何在此过程中保证二者兼容互通，并充分利用各自特性来更有效地开展各类应用足比较热门的

学位

IPv6IPv4QoS隧道系统隧道驱动隧道管理

基于MPEG-4的网络视频监控系统视频实时传输的研究

近年来,随着Internet和视频编码技术以及硬件的快速发展,网络视频监控技术迅速发展起来。MPEG-4视频的实时传输在网络视频监控系统中具有非常重要的地位,它对整个系统的健壮

学位

网络视频监控MPEG-4实时传输RTP/RTCP拥塞控制

基于自适应混沌的多核任务调度算法研究

随着高性能处理器的不断发展,异构多核处理器逐渐成为了现代处理器发展的方向。异构多核处理器具有效率高、成本低等特点,深受人们喜爱,也成为了当前的热门的处理器系统。多

学位

多核处理器任务调度混沌理论遗传算法蚁群算法

XML数据库中主动规则的研究与实现

本论文从当前XML数据库的应用和研究出发,分析了传统XML数据库应用模型中存在的缺陷,对数据库主动规则进行了探讨,对如何扩展到XML数据库进行了研究和分析,最后通过具体应用

学位

主动规则XML 原生数据库主动数据库

异构存储系统中的缓存技术研究

其他学术论文