基于机器学习的时间序列预测方法研究及应用

来源 :兰州大学 | 被引量 : 0次 | 上传用户:tklyzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列预测一直是人们关注的热点问题,通过精确的预测结果,人们可以提前安排工作,预防不利情况发生,对于制定政策有着非常重要的意义。随着科学技术的不断进步,时间序列预测方法得到了很大的发展,目前常用的时间序列方法有传统的时间序列预测方法和基于机器学习的预测方法。这些方法使用方便,操作简单,预测精度高,在业界得到了广泛的应用,但是这些方法用在不同的数据集中结果精度差距较大,不具有通用性。因此,目前很多研究者采用组合预测方法和混合预测方法来提高这些预测方法的通用性,通过将不同的传统时间序列预测方法和基于机器学习的预测方法相结合,充分利用各个模型的优点,尽可能地提高时间序列预测的精度。  本文首先提出一种新的时间序列预测方法 BP-SARIMA-ANFIS,该方法组合了反向传播神经网络(BP)、季节性差分自回归移动平均模型(SARIMA)和自适应模糊神经网络系统(ANFIS)。该方法首先用BP、SARIMA和ANFIS对原始时间序列数据进行预测,然后取三种方法得到的预测结果的加权平均值。权值系数在组合预测模型中有着非常重要的作用,本文采用微分进化算法(DE)优化BP-SARIMA-ANFIS方法的加权系数。通过对澳大利亚新南威尔士州的电力负荷数据进行模拟,并将 BP-SARIMA-ANFIS方法的预测结果与其它三种单一方法的预测结果进行对比,结果表明 BP-SARIMA-ANFIS方法有效地提高了电力负荷预测精度。  本文还提出一种基于改进的灰色模型和 BP神经网络的 GGNN混合预测方法。该方法将四种改进的灰色模型的拟合值作为BP神经网络的输入,经过反复的训练和拟合得到最终的预测值。该方法采用遗传算法(GA)对GGNN方法的权重和阈值进行优化。通过对历年中国石油消费数据的模拟和实验,并将 GGNN方法的预测结果和其它六种方法的预测结果进行对比和分析,验证了 GGNN方法的有效性。  核极限学习机(KELM)是基于核的学习方法,核函数在核极限学习机中占有举足轻重的地位。不同核函数蕴藏的几何度量特征各异,选择不同的核函数导致核极限学习机泛化能力存在差异。本文提出了一种新的组合核函数,该组合核函数将RBF和UKF核函数进行结合,并将该组合核函数应用到核极限学习机中(Mixed-KELM)。本文使用澳大利亚新南威尔士州、昆士兰州以及维多利亚州的电力负荷数据验证 Mixed-KELM方法的有效性。电力负荷受众多因素的影响,往往呈现出一定的随机性。因此在使用 Mixed-KELM方法对电力负荷预测之前,本文先用经验模态分解(EMD)对原始电力负荷数据进行降噪处理。实验结果表明,与RBF构成的KELM方法(RBF-KELM)、UKF构成的KELM方法(UKF-KELM)以及 Mixed-KELM方法相比,EMD-Mixed-KELM方法的预测结果精度更高。  核函数在支持向量机中占有极其重要的地位,是支持向量机理论成熟发展的关键。在利用支持向量机进行分类和回归时,如何选择合适的核函数,是获得较好分类和逼近效果的基础和前提。同时本文还将该组合核函数应用到最小二乘支持向量机(LSSVM)中,提出了一种新的EMD-Mixed-LSSVM预测方法。该预测方法先使用 EMD对时间序列进行降噪处理,再将处理后的数据输入到LSSVM中,在 LSSVM中使用本文提出的组合核函数进行运算。本文使用该方法预测了澳大利亚的电价数据,并将 EMD-Mixed-LSSVM方法的预测结果和其它方法的预测结果进行对比,结果表明,EMD-Mixed-LSSVM可以有效地提高时间序列预测的精度。  本研究的主要成果及贡献如下所示:  (1)提出了一种基于BP神经网络、SARIMA和ANFIS的组合预测方法,并对预测方法的有效性进行了验证。  (2)提出了一种基于改进的灰色模型和 BP神经网络的混合预测方法,通过对中国石油消费数据的预测验证了该算法的准确性。  (3)提出了一种基于组合核函数的核极限学习机预测方法,通过对澳大利亚三个州的电力负荷数据进行预测,实验结果表明该方法可以提高时间序列预测的精度。  (4)提出了一种基于组合核函数的最小二乘支持向量机预测方法,通过对澳大利亚的电价数据进行预测,表明了该方法的有效性。
其他文献
随着信息科学和计算机技术的快速发展,形式化建模和代数分析方法对复杂控制系统的合理设计和高效开发显得越来越为重要,而Petri网是目前一种重要的形式化建模和分析方法,具有
闪存是二十世纪八十年代东芝公司发明的一款新型存储器,它具有低功耗、高抗震、高速、非易失、体积小等优良特性,这些优良特性使得其被广泛应用于便携式设备以及嵌入式设备中
本文分析了数据挖掘和聚类分析的研究现状,指出数据挖掘中聚类分析需要进一步研究和解决的问题,将按安全多方计算协议与聚类分析相结合提出分布式聚类隐私保护算法,并在此基
随着成像设备的发展以及人们对计算机视觉系统精度和稳定性要求的提高,彩色图像分割已成为计算机视觉系统中一个基础而又关键的步骤,如何快速准确的进行高分辨率彩色图像处理
单样本人脸识别问题已发展成为模式识别、人工智能和机器学习领域中的一个热点和难点研究课题。目前大多数人脸识别技术的研究仅集中在怎样提高人脸识别系统的准确率上,并且
计算机立体视觉研究的主要内容是如何利用计算机实现人眼的视觉功能,即利用摄像机获得的投影图像实现对现实世界三维场景的识别与理解。立体匹配是计算机立体视觉研究领域最
随着计算机硬件软件和互联网技术的飞速发展,网络上的各种信息急剧增长,已经成为人类有史以来信息资源数量最多、信息资源种类最全、信息资源规模最大的一个综合信息资源库。
网络服务质量(Quality of Service, QoS)属于一种网络安全机制,它具备疏通网络交通、保证网络传输效率、防止网络阻塞等优势。目前的网络技术,在提高网络传输速度、保证网络
在这个信息爆炸的的时代,以关系数据和XML形式存储、交换和发布的数字数据显著地增加,特别是在互联网上,这种呈指数的增长是前所未有的。当然,这两种形式的数据不仅可以让使用者
随着信息化时代的不断进步,人们越来越多的依赖网络,每天产生的电子信息数以万计,如何对这些信息进行有效的归类成了一大难题。数据挖掘技术的出现给人们指引了一条解决文本