论文部分内容阅读
我们生活在一个数据信息的时代,人们的日常生活已经离不开数据和信息了,并且随着时间的推移,数据开始呈现出爆炸式增长的趋势。在数据急速增长的背后,完成对这些数据存储及加工的重任就交给了数据中心,数据中心为了应对数据大规模增长的趋势,它内部的IT设备及其它辅助设备的规模也会逐渐扩充,同时也会建造新的数据中心来保障新的需求。据估计,数据中心一年的电能消耗占全球总电能消耗的1.5%左右,相当于26个核电站一年的发电量,并且这个数字在未来还会增长。如果不能及时对数据中心的能耗加以管理、未采取合适的措施降低数据中心的能耗,那么就可能会出现能源紧缺,数据中心也不能及时的完成用户请求,这些都会影响到人们的日常生活的各个方面。为了将数据中心变成“绿色”数据中心,我们需要研究并发现数据中心能耗的因素,通过合理的改善这些耗能因素降低数据中心的整体能耗。这些因素可能是环境因素,也可能是设备因素。本文针对数据中心能耗数据的分析开展了相关的研究工作。主要的工作包括:1)通过数据挖掘聚类算法对数据中心内部设备的能耗进行聚类。由于同一种类型的设备能耗较为接近而不同设备类型的能耗差异较大,所以可以通过聚类结果发现某些异常耗能的设备,对这些设备加以改造改善其能耗。2)通过数据挖掘分类和预测算法对数据中心的历史数据进行分类并对未来进行预测。这里提出了基于数据中心的历史数据的分析对未来一段时间内的能耗或业务请求量等的预测,可以通过预测的结果,控制数据中心内部一些设备的状态(如开启或关闭),通过这种手段控制数据中心的能耗。3)建设开发能耗分析系统,使得算法可以运行在系统之上,并得以实际的应用。使用人员通过系统的使用,方便他的操作,系统也增强了人机的交互性。目前,系统的一期已经建设完毕,系统的功能包括统计分析,聚类分析、分类和预测分析三大模块。每个模块可以应用于不同的场景对能耗数据进行分析。