论文部分内容阅读
目前在我国电力行业中,火力发电无论是装机容量还是发电量均占据着绝对的主导地位。与此同时燃煤排放的污染物NO_x等成为大气污染物的主要来源之一。燃烧系统作为火力发电三大系统中唯一的热能来源,其运行状态直接影响着整个电站的能效。因此锅炉燃烧优化有着重要的研究意义。将智能算法运用到锅炉燃烧优化是节能减排的重要措施之一。随着DCS系统广泛应用于电站锅炉中,越来越多的运行数据得以保存,这为后续数据的分析挖掘提供了可能,但同时海量的运行数据也对传统机器学习算法提出了更高的要求,即需要算法能够处理海量数据。此外在锅炉优化过程中,每个时间段内用于发电的煤的煤质是不同的,而且随着设备的老化,设备中的固有参数也不会是一成不变的,这就对控制算法提出了更高的要求,即需要随着时间的推移能够定时更新算法。然而并没有一个成熟的锅炉燃烧优化算法能够同时满足处理海量历史数据且能通过在线数据实时更新已有算法,这正是本文要解决的主要问题。本文运用MapReduce的并行化思想,借助于Spark大数据平台,将传统在线极限学习机(Online Sequential Extreme Learning Machine,简称OS-ELM)的两个训练阶段分别进行并行化处理,通过性能优化,使得该算法既能处理海量历史数据,也能处理海量在线数据。本文的具体工作如下:(1)针对传统OS-ELM算法在处理海量高维数据时速度慢,单机内存不足等问题,通过分析OS-ELM算法的两个阶段,将其中耗费资源的求解广义逆矩阵过程进行拆分,之后运用MapReduce思想进行并行化,提出了本文的核心算法基于海量历史数据的分布式在线极限学习机算法(Massive Historical Data Distributed Online Sequential Extreme Learning Machine,简称MHD-OS-ELM)。该算法分为两个阶段:离线阶段可处理海量历史数据;在线阶段可以处理海量的在线数据。为了更高效的使用Spark集群运行算法,本文运用Spark优化技术对并行后的算法进行性能优化。并在UCI数据集上进行测试,验证了算法的有效性。(2)为提高算法在工业现场的实用性,在MHD-OS-ELM的在线阶段引入SparkStreaming技术。将锅炉运行中的实时数据通过SparkStreaming进行收集,之后逐批传入MHD-OS-ELM中进行在线阶段的计算。(3)将从电厂采集回来的数据进行预处理,然后分别建立基于MHD-OS-ELM的NO_x排放量和燃烧热效率预测模型。通过对电厂一个月的运行数据进行实验,验证了两预测模型均具有较好的准确度,且有一定的实时跟踪能力。(4)在两预测模型的基础上,运用权重系数法将多目标问题转化成单目标问题,并运用基于Spark的粒子群算法RD-PSO对模型的输入参数进行寻优。本文还将多目标预测控制算法(MOMPC)中选择最优解的方法引入权值系数法中,通过计算定量给出了系统的推荐比例,避免了复杂耗时的人为决策。