论文部分内容阅读
随着科技的飞速发展,现代流程工业越趋精细化和复杂化,政府设定的污染物排放标准也越来越严。过程监测作为维系流程工业生产安全、构建产品质量保证体系以及提升社会环境效益的重要手段,近年来得到了大量成功的应用。其中,以多元统计分析为代表的数据驱动监测方法因其概念简单、易于实现等优点受到研究人员的广泛关注。尽管已经取得了很多形式的研究成果,多元统计分析方法在故障分离和诊断方面依然存在一定的不足,主要原因在于未从结构层面考虑变量相关关系、因果特性等更能刻画过程运行状态的结构化信息,而日益扩大的数据规模使得单纯的数据驱动方法较难避免所谓的“拖尾效应”(即异常信息在故障和正常变量之间传播)。为充分挖掘数据中潜藏的结构化信息,本文开展了基于结构化模型的过程监测方法研究。以多元统计分析、序列图模型、概率线性判别分析等为模型基础,以特征变量选择为关键技术,结合过程特性、系统原理等先验知识,开发了相关的故障检测和诊断方法。在方法的设计过程中,进行了过程建模、故障信息提取以及数据可视化等研究工作。具体内容如下:1.针对PCA在故障分离和诊断方面遇到的“拖尾”问题,提出了一种SJSPCA模型。该模型依赖由l2,1范数和图拉普拉斯正则项组成的结构化正则项,充分挖掘了过程数据的相关关系,实现了过程异常信息的结构化表达。l2,1范数具有一致选择特征变量的优良特性,图拉普拉斯约束可以挖掘数据潜在的图结构关系,两者分别作用于PCA载荷矩阵,可实现过程变量的结构化选择,直接为过程异常信息的结构化表达创设了先决条件。在故障分离阶段,稀疏步骤逐行删除载荷矩阵中的无用信息,留下了足以表征故障信息的非零元素;分离步骤中,PCA的数据恢复矩阵可将故障/异常信息表达在载荷矩阵主元和残差子空间的相应行中,由此分离出一目了然的异常变量。2.为实现时变过程的变量关系可视化,结合稀疏高斯图模型、结构化正则项和数据滑窗机制,构造了一种SSGL模型。该模型所依赖的结构化正则项由两个l2,1范数构成,第一个范数正则项用于获得时变过程的总体变化趋势,后者则捕获过程中的突发异常事件,两者共同致力于挖掘过程数据中的图形化结构关系。在统一的基于图模型的过程监测框架中,故障检测的执行方式是对图模型的结构进行等价性测试,而故障分离可以通过观察图结构的变化获取,也可以基于异常图模型的重构优化得到更加稳定的故障分离结果。3.针对PLDA在处理数据较大类内方差问题上的不足,提出了一种I-PLDA模型。该模型通过对每类数据引入相应的类内载荷矩阵,将过程样本的类别信息通过逆类内方差矩阵固化在改进的模型中,为使用最大余弦相似度标准识别过程模态预设了模型基础,同时也提升了该方法的故障检测性能。在故障分离方面,基于相同的概率框架,引入了拉普拉斯先验重构检测到的故障样本的概率生成模型,在类内载荷变化矩阵的稀疏概率推断中实现了故障信息的结构化表达。实验证明通过稀疏概率重构的方式也能较好地分离故障变量,有效规避了传统模型在这一问题上的“拖尾”现象。4.提出了一种MRPLDA模型,用于处理工业过程数据的离群点、非高斯和较大类内方差等问题。该模型的构造依赖两个关键步骤:1)为类内潜隐变量和噪声预设能调整统计量敏感性的先验分布,使得模型能较大程度免于训练集中离群点或异常值的干扰;2)在混合概率分布的框架下,构造包含有限个RPLDA的混合模型,用于处理过程中的其它问题。在构造MRPLDA模型的基础上,引入了状态、组别等两组潜隐变量,形成了混合概率模型分类器,可用于识别过程故障,从而将过程监测的故障检测和分离等任务结构化地表达为故障分类器的分类行为。与此同时,还提出了一种由概率近似、证据推理以及投票决策的状态推断策略,增强了模型分类器的故障分类能力。