论文部分内容阅读
随着数据密集型应用和服务的越来越普及,大型数据中心消耗着巨大的电力资源。其中存储系统作为数据中心的能耗大户,能耗的占有比例达到了25~35%。而云存储作为未来存储发展的趋势已经被广泛的应用,如何降低云存储设备的能耗是一个迫切需要解决的问题。本文旨在联合数据分类、数据放置、数据备份和动态电压管理等技术达到降低云存储系统能耗的目的。本文介绍了存储系统降耗技术的相关背景和国内外发展状况,简述了云存储降耗技术的意义。其中,着重介绍了文中涉及到的神经网络模型技术、灰色关联度分析法技术及GridSim相关技术在课题中的运用。为了解决云存储系统中的能耗问题,本文的主要贡献是:提出了预判性绿色数据分类策略(AGDC)以及基于数据分类的绿色升降档机制(DGLG),该两项工作具体阐述如下:(1)设计并实现预判性绿色数据分类策略(AGDC):该策略对云存储系统中的数据进行分类,热数据存储于热磁盘区域,冷数据存储于冷磁盘区域,并且对季节热数据进行神经网络预测,预判该数据在下一时间段内的温度,将该数据在冷热区域中进行季节性迁移。本文还对新数据采用关联分析法分析它与存储系统中的旧数据的关系,对该数据的温度进行预判,同时建立了能耗模型,通过对能耗模型的分析证明:本文提出的预判性绿色数据分类策略具有降耗效果。同时基于GridSim的模拟实验表明:该分类算法在满足用户性能需求的前提下具有良好的降耗效果,其中在平均牺牲0.005s的响应时间下节省了16%左右的能耗。(2)基于预判性绿色数据分类策略(AGDC)的基础上,设计并实现基于数据分类的绿色升降档机制(DGLG)系统框架:该框架设计了新的数据分区策略、数据备份策略,并基于数据分区备份的基础上提出了能耗升降档机制:1)数据分区策略即通过预判性数据分类策略(AGDC)将数据分为冷数据、热数据、季节热数据和新数据并将其放入相应区域。其中热数据、预判为热的季节热数据和新数据依次放入源热数据区,冷数据、预判为冷的季节热数据和新数据依次放入源冷数据区(相关定义见4.1)。2)数据备份策略根据数据性质的不同,通过数学模型计算最小备份数并据此确定了备份数及备份的放置位置。其中越热的数据含有的备份数越多,能达到的备份区越高,越冷的数据含有的备份数越少,达到的备份区越低,预判为热的季节热数据和新数据只达到热区中的最小备份区。3)基于上述的数据分区、备份策略,本文提出了能耗升降档机制,该机制通过神经网络模型预测后续时段任务量实现自动升降档。同时根据提出的能耗升降档机制建立了相应的能耗与性能模型,通过对能耗模型的分析证明,本文提出的基于数据分类的绿色升降档机制可以达到降耗的目的。基于GridSim的模拟实验表明:该能耗升降档机制在存储小型文件的存储系统中能达到较好的能效。在存储小型文件的大规模存储系统中DGLG降耗效果一般可达43%左右。在系统负载较轻,开启最低档位的情况下可节省78%左右的能耗,在系统负载较重时,可节省16%左右的能耗。基于AGDC策略提出的DGLG升降档机制结合了数据分类、数据放置、数据备份和动态电压管理技术等能够降低能耗的方法达到了云存储系统中绿色数据管理的目的。