基于Hadoop的公共建筑能耗数据挖掘方法研究

来源 :山东建筑大学 | 被引量 : 0次 | 上传用户:Jeanneyli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国对公共建筑能源审计工作已全面展开,各省、市陆续建立了大型公共建筑能耗监测平台。目前,山东省对公共建筑进行节能监测的数量累计达到1000余栋。真实准确的公共建筑能耗统计数据对进一步推进建筑节能工作具有重大意义,但是目前对能耗数据的有效利用还存在明显不足。随着建筑能耗数据量不断增加,数据的分析工作也面临巨大的挑战。这些能耗数据背后蕴涵着丰富的知识,且数量巨大,传统分析方法难以发现和总结这些数据中所蕴涵的知识。本文探索了基于Hadoop的数据挖掘技术在处理海量建筑能耗数据中的应用。Hadoop是Apache软件基金会旗下基于Java语言开发的一个开源分布式计算平台,它允许将Hadoop集群部署在低廉的硬件上,用户可以充分利用集群服务器的存储和计算能力,完成海量数据的分析处理。在对Hadoop分布式计算平台深入分析研究的基础上,针对建筑能耗数据无法有效利用这一问题,本文提出利用Hadoop分布式架构,结合建筑基本信息对公共建筑能耗数据进行数据挖掘的方法。首先,本文对基于Hadoop的公共建筑能耗数据挖掘系统进行了初步设计,并对系统的基本架构和各模块的功能进行了设计和说明。其次,在对HDFS的架构和数据读写机制进行深入学习和研究的基础上,进行基于MapReduce编程模型的Java程序编写,实现将实验样本数据XML文件写入HDFS。然后,根据本课题数据挖掘需求和实验数据的特点,选择数据挖掘算法。在对MapReduce的架构和任务运行机制进行深入学习和研究的基础上,实现了基于MapReduce的改进Apriori算法、C4.5算法设计,以及算法的Java程序编写。最后,利用四台计算机搭建Hadoop集群作为实验平台,以山东省200栋办公建筑制冷期空调系统单位面积(月)耗电量为例进行能耗数据挖掘实验,得到了建筑基本信息与建筑空调能耗关系的相关结论,根据判定树和建筑信息可预测建筑物制冷期空调系统耗电等级,并对实验结论进行了评价和分析。本文利用Hadoop分布式架构结合建筑基本信息对公共建筑能耗数据进行数据挖掘,实现了对建筑能耗数据更大化的利用,弥补了以往的数据分析方法对海量数据处理时出现成本高、效率低的缺陷,对完善山东省公共建筑节能监测信息管理系统的数据分析功能进行了探索,从数据的角度客观地分析建筑能耗情况并为节能工作提供决策支持。本课题所涉及的思想和方法可推广应用到各类建筑能耗数据挖掘工作中,对既有建筑的节能改造和新建建筑的节能设计提供参考和借鉴。
其他文献
传统电压源型逆变器属于降压式逆变器。在某些特定的应用场合,为获得较高的输出电压,必须增加额外的Boost升压电路。这种两级变换式电路拓扑不仅降低了装置的可靠性和效率,而
语音端点检测是语音分析、语音合成和语音识别中的一个必要环节。尽管语音端点检测技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时由于噪声的引入和环境的
使用全景视觉传感器一次能够获取水平方向360度、垂直方向超过180度范围的场景图像,因此在实际中得到越来越广泛的应用。传统图像传感器由普通镜头成像,仅能观测到几十度视场