论文部分内容阅读
随着工业信息化、数字化的发展,越来越多的工厂系统中积累了大量的工业数据。工业数据通常具有数据量大、时间性强、非线性、含噪声等特点,这使得对工业数据信息的挖掘十分复杂。另一方面,工业数据被认为是未来工业在全球市场竞争中的关键,研究人员十分关注对工业大数据的搜集和特征分析,从而为生产制造过程提供战略支持。例如钢铁企业为了更高效的利用副产煤气,生产现场的调度人员大多结合基于历史数据的煤气流量预测结果对系统进行定性平衡调度,这使得预测结果直接影响平衡调度水平。鉴于工业能源管理系统中积累的大量的历史生产数据,采用基于数据的时间序列预测分析方法对流程工业数据进行预测,从而制定能源平衡调整方案保证工业生产过程平稳运行,是提升企业的竞争力的有效手段。针对工业系统数据的预测问题,本文提出一种基于共享储备池模块化的神经网络预测模型。该方法首先按照神经网络的状态空间分割的原则,采用K均值聚类方法将样本数据分为若干类,再对数据重构以建立预测模型。在建模过程中提出一种改进的回声状态网络,通过对神经网络进行模块化处理能够将问题求解空间分层,相比单一神经网络具有更好的泛化性能。在网络训练过程中,将其化简为多个小网络进行并行训练,从而加速模型计算过程。同时,引入大规模数据集提高了模型的预测精度,并应用MapReduce并行计算框架加速问题求解过程以保证算法的实时特性。为验证本文方法的有效性,分别选取Mackey-Glass标准数据集和国内某钢铁厂实际生产数据进行实验,首先与已有的多种相关方法进行关于预测精度的对比实验,然后测试本文方法的并行化效果。实验结果表明,本文方法对实际数据预测在精度方面具有一定优势,并且本文方法对大规模数据建模的具有更优的时效性,可以为后续系统的平衡调整提供科学的依据。