论文部分内容阅读
随着现代工业过程不断朝着大规模、复杂化、集成化的方向发展,综合考虑系统安全、产品质量和企业效益等因素,建立有效的过程监控方法十分重要。基于解析模型的方法受制于对实际流程过程的认识,基于知识的方法受制于复杂的逻辑推理。随着集散控制系统(Distributed Control System,DCS)和智能化仪表及现场总线技术在工业系统中的广泛应用,大量的数据易于采集和存储,数据驱动的过程监控方法应运而生。 实际生产中,为追求利益最大化,单一的生产线有可能频繁调整产品、调整生产策略,以应对市场的需求,使得系统经常运行在多个模态之下。多模态过程监控可以处理复杂的数据对象,成为过程监控领域的研究热点。监控多模态过程的策略主要有多模型方法和单模型方法。多模型法对多个运行模态建立相应的监控子模型,需要考虑模态划分及确定最终的监控结果。单模型方法只建立一个包含各个单一模态数据特性的全局模型,需要考虑数据复杂分布对模型精度和监控统计量的影响。本文旨在针对工业过程中的复杂数据分布、多模态问题,提出新的过程监控方法。主要研究工作包括以下几个方面: (1)基于局部离群概率(Local Outlier Probability,LOOP)算法与支持向量数据描述(Support Vector Data Description,SVDD)算法,提出了一种多模态过程监控领域中的多模型建模方法(Multiple Support Vector Data Description,MSVDD)。根据提出的聚类方法对多模态数据进行模态划分,在每个单一模态中建立SVDD模型。然后,根据测试样本对每个单一模态的离群概率选择合适的模型进行过程监控。所提出的聚类算法不需要提前确定模态的个数,不会陷入局部最优。 (2)为了对各个单一模态进行建模,基于非负矩阵分解(Non-negative Matrix Factorization,NMF)和稀疏编码(Sparse Coding)算法,提出了一种新的建模方法稀疏性非负矩阵分解(Sparse Non-negative Matrix Factorization,SNMF)来进行化工过程故障监测。首先在非负矩阵分解基础上引入稀疏编码方法,可以得到对数据集更稀疏的表示。另外,在分解时对低秩近似矩阵进行正交化处理,从而在降维时除去变量中的冗余信息,将信息集中到更少的投影方向上。然后,用SNMF方法提取过程的潜变量,并定义新的监测指标进行故障监控,使用核密度估计(Kernel Density Estimation,KDE)方法计算新定义的监测指标的控制上限。将SNMF应用于过程监控,取得了比非负矩阵分解NMF方法更好的监控效果。 (3)基于两步子空间划分和局部离群因子(Local Outlier Factor,LOF)方法,提出了一种单模态建模方法(Two Step Subspace Division,TSSD)。将与主元空间相关性强的变量划分为一个子空间,与主元空间相关性弱的变量划分为一个子空间。利用雅克-贝拉(Jarque-Bera,JB)检验以测试数据是否服从高斯分布,将子空间进一步划分为高斯子空间及非高斯子空间。然后,在每个高斯子空间和非高斯子空间分别利用PCA(Principal component analysis)方法和ICA(Independent component analysis)方法提取特征并构造子空间统计量。将每个子空间的统计量整合,并基于局部离群因子LOF方法构建综合统计量。TSSD可以有效处理数据复杂分布问题,在一定程度上改进了过程监控性能。 (4)基于协调混合概率主元分析,提出了一种建立全局模型的多模态过程监控算法(Aligned Mixture Probabilistic Principal Component Analysis,AMPPCA)。利用混合概率主元分析构建多个局部概率模型,并且提取每个模态下的特征,然后通过信息损失最小化策略,将多个概率模型协调整合为一个特征空间,最后在这个低维的特征空间中建立T2统计量。不同于多模型方法中需要整合监控结果或选择合适监控模型进行监控,AMPPCA从整合监控模型的角度出发,把所有的局部子模型整合为一个全局监控模型,以有效利用到模态间数据的相关信息,为多工况数据的离线建模提供了一种全新的方式。 本文在对上述方法进行分析的同时,采用数值例子和连续搅拌反应釜(Continuous Stirred Tank Reactor,CSTR)及田纳西伊斯曼(Tennessee Eastman,TE)两个过程进行仿真,并与文献中类似的方法对比,验证本文所提出算法的可行性和有效性。