论文部分内容阅读
当今时代,物联网技术迅猛发展,带动了传感技术在各个领域的广泛应用。以工业领域为例,一个完整的工业系统通常由大量设备同时运转、互相协作以产生人类社会所需的资源和产品。这些设备通常部署了数以万计的传感器,以实时监控设备的运行状况。每个传感器会按照一定的采样频率采集反应设备某属性值的传感数据,并将产生的传感数据回传到数据中心。这种大规模、高速的传感数据流中隐藏了可以反应设备运行状况的重要信息。实际上当设备运行状况偏离正常情况时,反应该设备相关属性的传感数据往往会发生变化。这种偏离大部分数据行为特征的传感数据被称为“异常”。目前,存在许多基于传感数据的异常数据点(又称为孤立点、离群点)检测的相关工作。异常数据点的发生往往是瞬时的,不排除偶发性。而实际生产环境中设备故障通常发生在一段时间内。因此这类异常模式不能完全满足实际应用的需求。另一方面,传统的异常检测方法大多针对静态数据集。工业生产环境下的传感器通常持续不断的产生传感数据流,针对静态数据集的检测方法不能满足工业生产环境的实际需求。针对这一问题,本课题提出了一种面向大规模传感数据流的异常序列即时检测方法,以应对传感数据流的特征。本论文主要包含以下三个创新点:第一:针对传感数据流的特性,给出基于传感数据流的异常序列形式化定义。第二:针对传感流数据的特征,提出了基于衰减窗口的异常序列检测方法。并基于电厂数据,对本课题方法进行了大量的实验,以验证本方法的有效性和性能。第三:将本课题的检测方法应用于火力发电厂故障检测场景,设计并实现了基于传感数据流异常序列的火电厂故障检测系统。