论文部分内容阅读
数据驱动建模方法是目前模型化方法研究的热点问题之一,因其无需完全掌握系统内部的运行机理,便可依据输入输出数据建立有效信息的映射关系,在解决复杂系统测量、控制和优化等方面都发挥着重要作用。针对单一数据驱动模型存在的稳定性较差、有效信息提取不全面和预测精度不理想等不足,开展了多模型融合建模方法研究。研究工作主要包括基于同类子模型的多模型融合建模方法和基于异类子模型的多模型融合建模方法,用于解决复杂系统全局特性的描述问题,以实现提升模型整体预测性能的目的。将所提出的建模方法应用于CO2在离子液体中溶解度预测,用于验证建模方法的有效性,并进行综合评价。主要研究工作如下:(1)通过查阅国内外大量相关文献资料,对常见的数据驱动建模方法进行系统综述,并进行分析与归纳。针对各种化学、化工过程中的建模问题,系统分析了数据驱动建模方法及其在应用背景下的模型化基本理论和方法,总结了国内外研究现状,详细评析了各种建模方法的优缺点。重点综述了多模型融合建模方法的设计思想、研究现状及研究展望等内容;(2)针对单一数据驱动建模方法存在的有效信息提取不全面、稳定性不佳和预测精度不高等不足,提出了一种基于同类子模型的多模型融合建模方法。首先通过合理选择同一类型模型的不同模型参数,利用训练集建立了一组具有参数差异性的子模型,利用参数多样性的方法提取研究对象的不同信息,然后利用评估集筛选得到若干预测性能较优的子模型,分别采用基于偏差熵的线性融合方法和基于BP神经网络的非线性融合方法建立了两种融合模型,最后利用测试集测试融合模型的预测性能。采用UCI数据库的混凝土流动度数据集验证了该建模方法的可行性;(3)为了从模型结构层面解决数据中有效信息的提取和融合问题,以建立具有较好稳定性和预测性能的融合模型,提出了一种基于异类子模型的多模型融合建模方法。首先利用训练集建立一组包含不同类型模型(神经网络、支持向量机、极限学习机)的子模型,然后利用评估集从每一类子模型中分别筛选得到最优神经网络子模型、支持向量机子模型和极限学习机子模型,并分别采用最小化误差平方和法和信息熵法建立了两种融合模型,最后利用测试集测试融合模型的预测性能。采用UCI数据库的混凝土流动度数据集验证了该建模方法的可行性;(4)以CO2在离子液体中溶解度为预测对象,开展了多模型融合建模方法的应用研究。首先针对咪唑类离子液体的CO2溶解度预测问题,合理选择预测模型的输入变量,然后通过文献资料收集了大量样本数据,并进行数据预处理和样本集分组,最后分别采用基于同类子模型的多模型融合建模方法和基于异类子模型的多模型融合建模方法建立CO2在离子液体中溶解度预测模型。研究结果表明:与单一数据驱动模型相比,采用两种多模型融合建模方法所建立的预测模型都具有更优的预测性能;与基于同类子模型的多模型融合建模方法相比,由于子模型拓宽了数据中所提取有效信息的适应面,导致采用基于异类子模型的多模型融合建模方法所建立的预测模型具有更高的预测精度;在基于异类子模型的多模型融合建模方法中,与基于最小化误差平方和法的融合方法相比,采用分散模型差异度和误差因素的信息熵融合方法所建立的预测模型具有更佳的预测性能和稳定性。通过开展两种多模型融合建模方法的研究及其应用工作,结果表明多模型融合建模方法具有重要的理论研究意义和实际应用价值,这不仅对于进一步深入研究多模型融合建模方法,还是将其应用于化学化工中,都具有较好的借鉴意义。