论文部分内容阅读
随着工业过程的规模朝着复杂化、智能化、大型化等方向飞速前进,工业系统整合度变高且各单元结构也变得更加繁琐。对于这样的大型工业系统,一旦某个设备出现问题,就很可能导致系统整体停滞。因此,改善工业过程的稳定性和安全性成为了当下人们聚焦的热点,而故障诊断方法就是解决该问题的有效手段,其中基于数据及统计机器学习的诊断方式近几年来受到广泛关注。集成学习是机器学习领域中的模型增强算法,可以用于分类模型的集成,提高整体识别的准确率。因此,非常适合把集成学习应用在工业过程的故障诊断领域中。基于以上考虑,本文选取SOFC系统作为仿真验证平台,研究了工业过程中故障识别与定位问题,采用集成学习与统计机器学习方法相融合,提升工业过程的监控效果。本文的主要研究工作包括:1.针对系统老化过程中数据高维、非线性、复杂分布、变工况的情况,从模式分类的角度,提出了一种PCA-HSVM多故障识别策略。在原始的高维数据空间里采用PCA提取故障特征,降低数据的干扰;根据层级集成策略,利用验证集的分类准确率构建HSVM,与传统的多分类支持向量机相比,HSVM在保证识别精度的同时需要更少的分类器进行训练并且有效避免了训练样本不平衡的问题。该方法在SOFC系统的仿真平台上取得了良好的故障识别效果。2.针对并发故障组合情况数量巨大且难以识别的难题,本文利用多标签学习来实现并发故障的识别。由于并发故障是因为单故障组合而产生,于是把并发故障利用向量化标签来描述,构建单故障与并发故障的内在联系;然后把集成分类模型GBDT并行式改造为PGBDT算法,使得每个子GDBT给出一位二值标签,表示对应单类故障是否发生。该方法的优点为仅使用n维的二值向量标签即能展示2~n种并发故障类别,同时只需要单故障数据训练模型。与传统的监督学习模型比较,多标签学习模型在SOFC系统并发故障识别中具有更优异的性能。3.针对工业过程的故障定位问题,从数据驱动的视角,提出了一种融合特征聚类与特征选择的DBSCAN-RF故障定位算法。通过DBSCAN聚类方法把关联性高的变量聚成一簇,并结合RF特征选择方法,从每个特征簇中挑选对故障分类重要度较大的变量进行组合得到最终特征选择结果,实现了在挑选与故障发生密切相关的特征的同时对冗余特征进行了剔除。在SOFC系统上的仿真结果显示,新方法比传统的RF特征选择方法获得了更精确的定位效果。