论文部分内容阅读
监督学习的核心是训练数据具有标签,但用标签来描述工业系统的故障时,现有的标签方法具有很大的局限。故障的识别、定位、容错控制的信息在编码方法、存储格式、数据特征等方面不尽相同。基于数据挖掘的故障诊断的挖掘出的信息,例如,故障位置、故障类型、故障程度等信息数据在形式与标识上都存在显著差异。本文在深入了解生产过程中的过程特性、数据特性以及基于机器学习故障诊断方法的基础上,提出了一种张量标签学习的机器学习框架,来利用高维的张量标签将故障的识别、定位与控制问题统一到张量学习的框架中,将完整故障信息表示到故障张量中,综合评价故障诊断系统对故障的认知与处理能力。利用张量标签学习进行故障识别与定位,对工业系统和控制系统的故障进行精确的状态、位置以及类别的判定,进行快速完整的态势和威胁估计,从而利用容错控制对工业系统安全的故障威胁进行完整、高效、精确的处理。本文的研究内容主要有:(1)本文首次提出了一种张量标签学习的机器学习框架。本文将分类中的标签拓展为高维的张量表示形式,并给出了高维标签流的评价标准。本研究将监督学习、多标签问题统一到张量标签学习的框架中,作为0-阶张量、1-阶张量学习的特殊情况。然后,将故障的识别、定位及容错控制统一到张量维度的标签学习中,给高阶的张量标签赋予了实际的含义,从更高的信息维度对故障进行了认知。利用张量标签学习,故障的信息可以进行张量形式的表示,在同一种张量标签的维度下可以同时表示故障的类别、位置以及对控制器的影响,最后通过高维信息的评价标准对识别、定位与容错控制进行定量化评价。张量信息化表示,可以定量化的评价故障诊断系统的故障的认知能力和处理能力,实现海量、多源、异构信息的统一整合、信息表示与统一评价。(2)针对并发故障组合模式众多难以训练完整的难点,本文利用1-阶张量标签学习来解决并发故障的识别问题,首先针对的是训练数据具有丰富的标签样本的情况,并发故障由于是单故障模式的混合会造成模式识别困难、模式组合众多难点,传统的学习标签方法很难解决并发故障的识别问题。本章利用提出的1-阶张量标签学习的方法,将并发故障利用1-阶张量标签进行描述,然后,根据标签的格式改进学习器的标签维度构成了一种1-阶张量标签学习模式识别方法。通过对二分类器的并行化处理,每个并行化的子分类器输出一位向量化标签的方式,实现并行化SVM算法。本方法的优势在于,采用n维二进制向量编码标签就可以表示2n类的并发故障类型,极大的缓解了并发故障类型数量灾难的问题,仅采用独立的n类单故障的训练数据就可以预测2n类并发故障的类型。(3)针对并发故障带标签的样本数据量稀少的情况,本文提出了一种向量化标签-迁移学习的策略,用于解决并发故障识别带标签的训练数据稀少无法学习得到学习器预测函数的难题。本文提出的并发故障识别系统包括两个部分:向量标签-迁移学习框架和并行随机森林机器学习算法。本方法采用1-阶张量标签的形式建立起不同数据域之间的联系,通过数据量大的单独故障学习足够的数据分布信息,然后将学习器参数迁移到并发故障学习器上,这样学习器的训练阶段分为两个部分:初始训练阶段和迁移学习阶段。根据标签的格式改进了基于决策树方法的并行随机森林算法。实验结果表明,本方法可以采用非常少的目标域数据就能快速的得到并发故障识别的模型。(4)为了解决基于数据模式的故障定位问题,本研究提出了基于特征选择可以进行故障定位的条件。然后,针对于基于相似性度量的故障定位系统进行了研究,采用了一种新的特征选择算法,基于不同类型故障样本之间的相似性度量,同时去除特征之间的相关性来挑选出与故障类型最为相关的特征,实现故障定位。本研究采用优化的Relief F特征选择算法选择与故障模式最相关的原始特征,通过本变量在系统中位置确定故障的位置,通过在SOFC系统上的实验仿真验证该方法的可行性。为采用同一套算法同时解决故障的识别与定位,本章采用随机森林的特征性度量来选择合适个子集,从而确定故障发生的位置。通过张量标签学习的定量化评价,定量化评价了故障定位的精度。最后给出了故障识别与定位的张量化标签处理算法框架。(5)为了实现故障的在线容错控制,针对可采用控制方式恢复的故障,不用停机的情况下进行在线的智能故障恢复。本文利用故障识别与定位算法得到的结果,利用0-阶张量标签学习结合离线的控制参数整定方法,设计了一种基于故障识别结果的控制律重新调度型主动容错控制器,来应对工业系统的故障恢复。