论文部分内容阅读
随着数据存储技术的发展和智能监测装置的普及,电网电量数据的规模和维度都得到了空前的拓展,迫切需要应用大数据技术进行深入挖掘和分析,以获得更高的电量预测精度。因此,本文以电量数据作为研究对象,重点围绕电量数据的清洗和电量的精确预测展开研究,主要研究内容如下:1)针对电网电量数据的数据清洗和标准化展开研究。针对电网电量数据库中存在的数据离群、数据缺失等问题,提出基于改进KNN算法的离群点快速检测算法和缺损数据递归填充算法;针对电量数据间数量级差距大的问题,提出最大值归一化的标准化方法。2)针对电量曲线平稳性较差、季节波动剧烈的问题,结合X-12-ARIMA程序和我国月度电量季节波动实际,对行业电量时间序列进行季节调整,提高了电量序列的平稳性。3)为了降低建模和计算的复杂度并分离出不规则元素,提出电量数据的改进K-means聚类算法。针对聚类算法的收敛性问题,给出初始聚类中心的优选方案,包括核心聚类对象的筛选和利用距离权重分散选取初始聚类中心的方法。为了使波动趋势类似的行业可以被归入同一类,提出带权重的改进距离算子,通过欧氏距离算子和曲线相似度算子的加权组合,获得了更好的聚类效果。引入轮廓系数对聚类结果进行优选,获得了最优的距离算子和聚类数。4)定义电量数据的层级,提出基于下级电量曲线季节分解和聚类结果的上级电量预测算法。通过对预处理后的行业电量数据进行季节调整,将电量序列分解为季节周期项S和趋势循环-随机项TCI:季节周期项采用ARMA进行预测;调整后的TCI曲线则需要先对全行业进行聚类,再根据聚类结果选择最适合每类的预测方法分别进行预测。聚类中分离出的不规则行业人为归为一类单独考虑。最后将各行业各季节分量的预测值进行综合,得到地区月度用电量的预测值,预测结果精度较高。该方法同样适用于利用大用户电量数据预测行业电量增长等情况。