工业过程异常数据检测算法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:tiantianweb9737l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据驱动技术在当今工业过程中的广泛应用使得异常数据问题变得十分突出。然而,由于工业系统及其工作环境的复杂性,异常数据的检测通常面临各种各样的挑战。首先,缺乏真实的“数据标签”是工业数据最显著的一个特点。由于对数据进行标记通常需要具有领域知识的专家手动完成,因此是一项十分困难的任务。其次,工业数据的成分比较复杂。绝大多数工业系统不仅存在多个正常的工作状态,还存在一些异常状态,这导致工业数据不仅包含了大量的正常数据,还包括了部分未知的异常数据。最后,高维数据也是工业数据的一大特点。随着工艺要求的不断提高,工业系统变得日益复杂化,过程变量的数目也随之不断增加,导致导致过程数据呈现高维的特点。总结来说,工业数据独有的特点给目前的大多数异常数据检测方法都带来了一定的挑战,直接应用这些方法可能会产生难以预料的损失。因此,提出专门的异常数据检测算法显得势在必行。基于工业数据的特点,本文提出了一系列的专门应用于工业过程中的异常数据检测算法。主要研究内容可以归纳为:1.为了解决工业数据无真实标签的问题,采用了一种半监督学习,即单类分类器,作为整个检测模型的基础。对比无监督学习,半监督学习在测试阶段拥有更低的计算复杂度,更加适合在线检测;2.为了克服工业数据成分复杂的问题,提高单类分类器对训练集中未知异常样本的鲁棒性,提出了一个鲁棒SVDD(支持向量数据描述)检测模型。在此模型中,利用了一种类似Boosting算法的数据处理方式,通过对训练集的多次调整,降低最终模型的偏差;3.为了解决单个模型存在的高方差问题,缓解在模型选择阶段存在的高风险问题,以及提高对高维数据的适应性,提出建立集成的异常数据检测模型。在集成模型的框架内,初始检测模型和核心检测模型被先后建立,目的是应付在线检测不同阶段的工艺要求。其中,初始检测模型是在“小样本”问题下所建立的集成模型,而核心模型则是在训练集中包含已知异常样本的情况下建立的集成模型。因此,核心模型不仅考虑了集成单类分类器,还考虑建立了二分类的集成模型。此外,考虑到训练集中可能存在多个工作点数据的情境,提出了一个基于聚类分析的集成检测模型,目的是克服单个模型可能存在高漏报率的情况。为了充分挖掘基学习器的潜能,以进一步提高静态集成模型的检测性能,提出了一个动态的集成异常数据检测模型。4.最后,将预测模型进行了拓展。考虑到预测问题在工业中的普遍性以及重要性,提出将检测问题融入到预测问题中,目的是在预测的同时能够对实际测量值进行实时的检测,同时还能得到带标签的数据集,方便其它基于此数据集的分析。思路是利用一种贝叶斯范畴内的回归模型得到预测分布,然后此分布建立检测模型。为了克服基于预测模型可能存在的高漏报率情况,提出了基于高斯过程分类的检测模型。在得到预测模型之后,利用Laplace近似等方法将其转换为分类模型。同时,为了降低单个模型的风险,得到更加鲁棒的结果,同样建立的相应的集成模型。
其他文献
中国的三叠系海、陆相同时发育,沉积类型齐全,分布广泛,但其分布和发育很不均衡,总体呈现为"南海北陆、东简西杂、下全上缺"的格局。中国南方(包括青藏高原)海相三叠系的基本生物-年代地层框架中,下三叠统直到上三叠统卡尼阶具有区域对比意义,部分标志甚至具有全球对比意义。中国陆相生物-年代地层框架可作为区域陆相地层对比的参照系。在童金南等(2019)对中国三叠纪年代地层、生物地层、磁性地层和化学地层等归纳
钛合金凭借其超高的比强度和优异的耐腐蚀性能被广泛应用于航空航天领域,然而活性高、热导率低以及变形抗力大等特点使其采用传统制造方法加工非常困难。此外,航空航天零件趋于功能化、轻量化和结构一体化设计,传统制造技术愈发难以满足航空航天复杂结构钛合金零件的制造需求。激光选区熔化(Selective Laser Melting,SLM)成形技术基于“离散-堆积”增材制造理念,可直接成形出点阵夹芯、异形曲面、
非线性特性广泛存在于电力电子、航空航天、化工过程等控制系统中,这增加了系统分析与综合的难度。为解决非线性问题,Takagi与Sugeno于1985年提出了Takagi-Sugeno(T-S)模糊模型。T-S模糊模型具有良好逼近非线性函数的能力,同时,在该理论框架下,很多优秀线性系统研究成果可以被借鉴解决非线性系统问题。在过去的几十年中,T-S模糊系统受到了学者们的广泛关注,并取得了许多有价值的学术
本文围绕矿井深部开采富含瓦斯、低渗透煤层过程中瓦斯防治重要的基础理论——工程扰动下富含瓦斯煤岩层损伤破坏演化、瓦斯运移及其测试方法这一系统问题展开研究。理论分析掘进、爆破及开采扰动富含瓦斯煤岩层损伤破坏演化机理、瓦斯渗流和瓦斯涌出规律;实验研究深部矿井煤系煤层和岩层瓦斯赋存的基本规律和工程扰动下富含瓦斯煤岩层损伤破坏演化规律;结合实验矿井煤层地质条件数值模拟研究沁水煤田实验煤层在工程扰动下富含瓦斯
水利工程是国民经济基础设施的重要组成部分,在防洪安全、水资源合理利用、推动国民经济发展等方面具有不可替代的重要作用。由于大型水利工程规模大、技术复杂、工期较长、投资多,这对水利工程结构的耐久性要求尤为严格。水利工程混凝土结构最常见问题为裂缝、冻融破坏、钢筋锈蚀及碱骨料反应,特别是对于北方严寒地区的水工大体积混凝土,冻融破坏尤为严重。水工混凝土耐久性最薄弱部位为水位变化区,其所处的真实服役状态为应力
中国的侏罗系以陆相地层为主,仅在西藏地区和黑龙江东北部发育海相地层,华南早侏罗世也存在较广泛的海相及海陆交互相沉积。中国侏罗系不同陆相盆地间的岩性和化石存在较大差异,长期以来争议很大,特别是同位素年代学和生物地层学的结果存在严重分歧。本文根据地层特征,结合大地构造和古地理等因素,将中国侏罗系分为5个大区,其中陆相盆地的基本规律为:西部区大型盆地侏罗纪沉积发育相对完整,东北—华北区缺失早侏罗世沉积,
技术创新是推动经济发展和社会进步的强劲动力,更是企业获得核心竞争优势并实现持续发展的力量源泉。近年来,随着垂直价值链的分工与合作日益深化,产业链上下游之间的联系变得愈发紧密,企业的竞争优势已不完全取决于“点”与“点”之间的横向竞争,而是越来越多的受到“链”与“链”之间纵向关系的影响。在以技术创新为驱动力的大背景下,企业在创新发展过程中所处的产业链上下游交易环境己成为影响其技术创新动力与研发投资效率
碳钢作为一种重要的金属材料,在机械制造、交通运输、化学工业、管道、采矿及建筑业等各个领域都有广泛应用。但碳钢易被腐蚀,腐蚀不仅严重影响碳钢的强度、安全性及美观性,而且还可能导致事故或其它更严重的后果。有机涂层保护是行之有效的碳钢腐蚀防护技术,具有施工简单、成本低等优势而被广泛应用。但是传统的有机涂层在使用过程中容易出现裂纹或缺陷,腐蚀介质可通过裂纹或缺陷渗透至涂层/基体界面使得涂层防护失效。近年来
随着能源危机和环境问题的日益严峻,能量转化和存储日益受到关注,多级功能微纳结构构筑是提高能量转化和存储效率的有效途径。本文利用绿色高效的电化学技术构建了几种多级微纳米功能材料,利用扫描电镜(SEM)、透射电镜(TEM)、X射线衍射(XRD)、X射线光电子能谱(XPS)、能量色散X射线光谱面扫(EDX)、傅里叶变换红外光谱(FT-IR)、拉曼光谱(Raman)等手段表征了产物结构、形貌和化学组成,利
车辆作为满足人们出行、运载需求的最重要方式之一,历来为最新技术应用的重要领域。而作为新一轮工业革命的重要技术群落,智能化技术理所当然地被运用于汽车领域。特别是智能汽车,通过集成、使用包括先进电子传感器、低时延网络通信设备、高算力计算机、电控执行机构等,对传统汽车进行全面升级,减少人员对车辆的劳动力输出,使得车辆可以更全面地为人提供更为优质的服务。从泛化概念来讲,智能汽车应该是包含无人驾驶系统、智能