论文部分内容阅读
时间序列由根据时间顺序测量的确定的数值组成,其中每个观测值都在按照顺序时间被记录下来形成了按照时间顺序进行排列的集合。时间序列数据中的变化点检测可以揭示重要的与时间无关的信息和知识,从而为许多数据流应用程序提供更有效的决策制定,现已广泛应用在工业、计算机、视频监控等领域,因此针对时间序列的变化点检测研究具有现实意义。周期时间序列是时间序列的重要组成部分,由于周期时间序列存在周期性或者季节性使得原始变化检测算法的检测效率不高。因此设计一种针对周期时间序列的变化检测算法是有意义的。由于周期时间序列存在周期性,会影响后续的变化点检测方法,因此首先要对周期时间序列进行周期估计,本文提出了基于动态时序弯曲的周期估计方法,该方法将周期估计问题转化为寻找多个候选片段迭代匹配最优化的问题,并通过仿真实验验证了周期估计算法的有效性,最后进一步定量分析了信噪比对周期检测算法的影响。在对周期进行估计后,我们设计了针对周期时间序列的变化点检测算法,该算法分为三步:时间序列建模、时序异常度计算、变化点决策。首先我们通过数学模型表征时间序列状态变化,将周期时间序列映射到线性模型中,然后提出了基于自回归积分滑动平均模型(Autoregressive Integrated Moving Aver-age Model,简称 ARIMA)的周期时间序列模型,得到了对应模型参数作为异常度计算的基础。其次通过对预测值和实际时间序列值之间的残差值计算时序异常度,通过异常度计算我们可以定量描述时间序列的时序波动情况。最后,构建了基于鞅理论变化点决策机制进行变化点决策,变化点决策是在时序异常度的基础上通过随机幂鞅并结合Doob极大不等式实现对算法的假设检验。为了验证算法的有效性与可行性,我们对此进行了大量的实验,首先建立了三种不同变化类型的仿真数据,并在三种评价指标(查全率、查准率、F1)上进行了验证,结果证明我们提出的方法具有良好的效果。进而我们在心电图数据、气候数据和旋转机械数据上分别进行了实验。在心电图、气候数据和旋转机械上的实验可以证明所提出的算法在变化点检测问题上的有效性。最后我们对算法的计算效率进行了分析和讨论,结果证明所提出的的框架在计算时间与时间复杂度上具有良好的效果,因此该方法可以实现在现实世界中的应用。研究结果表明所提出的的周期性时序数据变化点检测算法能够:(1)自动化更新自身参数;(2)不需要参考模型和先验知识;(3)可以实时在线检测。