论文部分内容阅读
化工过程具有非线性强、标签数据稀少和动态变化等特点,数据驱动的化工过程异常工况识别有助于工艺作业人员保持化工过程平稳运行,因此针对性地设计异常识别模型识别工况类型至关重要。特征自适应方法能够减少过程变化对于异常识别模型识别精度的影响。主动半监督的深度学习异常识别模型能够提取化工过程数据的深层次特征,通过专家知识提升异常识别模型自学习上限,充分利用无标签过程数据提高异常识别模型的识别性能,实现化工过程异常工况的准确识别。本文提出了一种基于特征自适应与动态主动深度分歧(Feature Adaptation-Dynamic Active Deep Disagreement,FA-DADD)的化工过程异常识别方法。首先,提取了化工过程离线数据的时域特征和频域特征,构建了两个充分冗余且满足条件独立性的源域(训练集)和目标域(测试集)。其次,对时域特征和频域特征分别构成的源域和目标域的特征分布进行了自适应。然后,选用卷积神经网络(Convolutional Neural Networks,CNN)和长短期记忆网络(Long Short-Term Memory Network,LSTM)基学习器,融合动态主动学习,采用分歧的指导思想,形成了FA-DADD异常识别模型。最终,基于分布一致的新源域和新目标域训练FA-DADD异常识别模型,通过历史、当前和未来的伪标签置信度均值动态优化FA-DADD异常识别模型的伪标签置信度,采用动态主动学习挑选高熵值无标签过程数据,标记它们并添加到有标签源域,重新训练FA-DADD模型进行化工过程异常识别。为了证明FA-DADD异常识别模型的有效性,对比分析了A-DADD、F-DADD、FA-DD和FA-DADD异常识别模型的性能。基于单设备的脱丙烷精馏过程验证了以上异常识别模型的有效性,结果表明FA-DADD异常识别模型的平均F1分数为99.73%、平均FPR为0.87%、平均FDR为99.63%、平均计算时间为29.33 s。与A-DADD、F-DADD和FA-DD异常识别模型相比,FA-DADD异常识别模型的平均F1分数分别提高了2.96%、5.27%和7.54%。将FA-DADD异常识别模型应用于多设备的田纳西-伊斯曼(Tennessee Eastman,TE)过程,结果表明,该模型的平均F1分数为99.09%、平均FPR为0.32%、平均FDR为98.57%、平均计算时间为26.76 s。为了证明FA-DADD异常识别模型的优势,与传统的主成分分析-动态主动安全半监督支持向量机(Principal Component Analysis-Dynamic Active Safe Semi-Supervised Support Vector Machine,PCA-DAS4VM)还进行了性能对比,结果表明FA-DADD异常识别模型的平均F1分数提高了0.55%、平均FPR降低了15.27%、平均FDR提高了1.02%、平均计算时间降低了79.47%。