论文部分内容阅读
工业环境中存在着大量的电磁干扰,使得工业数据的测量值在真实值周围上下波动,给数据增添了随机性,除此之外,工业数据自身也具有一定的随机性。这些随机性对时间序列的单值预测质量可造成不利影响。时间序列的单值预测只能给出数值的变化趋势,无法提供关于随机性的信息。相对于单值预测的另一种形式是区间预测。区间预测不仅可以提供数据的变化趋势,还可以提供数据的波动区间,即是一种可提供完整预测信息的预测形式,因而得到研究和关注。过往研究和应用证明神经网络拥有非常好的非线性处理能力,特别是递归神经网络,更能够反映时间序列的时序特性,而神经网络与统计学方法结合做区间预测也被实践证明具有较好的实用效果。针对含噪声工业时间序列的区间预测问题,本文提出了一种基于变分推理ESN集成模型的区间预测方法。主要创新点有两点:首先是在模型构建阶段,令ESN集成模型中每个回声状态网络的输出连接向量分布都具有独立的方差,相比非独立形式更有利于模型稳定性;其次是在模型参数求解阶段,本文提出采用变分推理来近似推导出集成模型中所有不确定参数的联合后验概率分布,相对于已有ESN集成模型使用最大边缘似然参数估计求解参数的方法,不仅仅能够给出参数估计值,还可以给出参数的近似后验概率,并且对噪声参数估计更准确,可使模型泛化能力更好。为验证提出方法的有效性,首先使用人工数据集来进行参数评估实验,采用噪声分布方差比值和均方根误差来评价参数估计准确度和结构合理性,实验结果表明变分推理的参数估计更准确,使用多组神经网络的参数估计结果更稳定;然后使用来自钢铁企业的真实煤气数据来进行实际的工业数据区间预测,将本文方法和六种主流的、具有可对比性的基于神经网络的区间预测方法来进行对比,采用均方根误差、区间质量综合评价参数和耗时来量化区间预测结果。实验结果表明本文方法在预测精度、区间质量和模型稳定性以及耗时方面均表现优秀。