时间序列的分割及不一致发现研究

被引量 : 0次 | 上传用户:yyy8881200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是随着时间次序而变化的系列数据。时间序列的分割和不一致发现在许多领域非常重要,如金融数据的分割、太空遥感和医学等数据的不一致发现、网络监控、移动对象轨迹流的跟踪和异常检测等。针对时间序列的分割和不一致发现方面存在的不足,开展了以下研究工作:基于符号化表示的时间序列分割、基于符号化表示的时间序列相似性度量、基于预测的时间序列分割、基于比特表示的静态时间序列不一致发现、基于分形的时间序列流异常检测。针对基于符号化表示的已有分割方法只反映子段均值信息却丢失趋势信息的现状,提出基于趋势的符号化表示(Trend-based Symbolic approXimation,TSX)的分割方法。在对时间序列降维获得子段均值信息的同时,提炼出时间序列子段的重要趋势特征,并设计多辨析率的角度分裂区间查找表,将趋势特征离散化为符号,进而获得既提取均值信息又反映趋势信息的时间序列的符号化降维表示TSX。实验结果表明,在相似搜索中,基于TSX的分割较基于符号聚集近似法(Symbolic AggregateapproXimation,SAX)表示的分割可以更有效地支持相似搜索,错报率较低。由于基于符号化表示的时间序列分割的度量MINIDIST_PAA_iSAX不具有对称性,提出了基于SAX的相似性度量方法Sym_PAA_SAX。Sym_PAA_SAX考虑了待衡量的两条时间序列在距离计算中的地位对等性,使该度量方法不仅具有对称性,而且满足下界定理。实验显示,Sym_PAA_SAX的下界紧密性较好,错报率降低。为适应时间序列流数据在线、快速、数据量大、无法全部保存的重要特征,提出基于指数平滑预测的时间序列流的分割算法(Exponential Smoothing Predictionbased Segmentation algorithm for time series stream,ESPS)。运用经典的指数平滑法提前计算未来时刻的平滑值并作为其预测值;提出预测误差判定定理,保证预测误差的正态分布,并进一步推导出预测误差与压缩率之间的关系,为判定数据点是否为分割关键点确立了依据;基于基本滑动窗口模型,设计了ESPS算法。为弥补大多数已有的分割方法仅仅以分割后的总驻留误差作为衡量标准的缺陷,实验中采用标准分段数、标准总误差、标准总性能、计算时间等作为评估的指标。实验结果显示,相对于滑动窗口算法和滑动窗口自底向上算法,ESPS算法效果较好、效率较高。为解决不一致发现中算法复杂度高、计算量较大的问题,提出了基于比特表示聚类的静态时间序列不一致发现算法。首先,对给定原始时间序列采用基于PAA方式比特序列化的方法进行分割,该方法不仅提取了原始序列的主要趋势特征,而且能够避免噪声的影响;然后,基于比特表示并利用聚类可以加速的思想,提出了变形的k中心点聚类算法,将具有相似变化模式的子序列归为一类;基于该聚类算法提出了不一致发现的算法,算法中采取了启发式剪枝和根据簇中心距离剪枝两种剪枝策略。实验结果说明,基于比特表示聚类的不一致发现算法有效性较好,效率较高,且具有扩展性。时间序列的不一致发现可以应用于异常检测。为改进已有时间序列流的异常检测的效果,提出了基于分形的时间序列流异常检测算法。由于关联分形维数的改变可以用作数据集中数据趋势改变的指示器,因此,采用含有基本窗口的滑动窗口模型,利用关联分形维数捕获滑动窗口中当前可见数据的模式特征,设计了基于分形的异常检测算法。与基于TSA-tree的方法、基于免疫的方法的对比实验显示,基于分形的异常检测方法可以有效地发现异常。
其他文献
当前,我国已步入全面而深刻的社会转型期,各种社会矛盾凸显,“群体性事件”一词频繁进入人们视野,而且从少量到多发,从局部到大范围,规模逐渐扩大,涉及面越来越广,影响到正常的社会秩
分析了已有GM(1,1)模型和离散GM(1,1)模型的不足,建立了高校招生人数的直接离散GM(1,1)模型,并对相关实例建立模型进行预测.预测结果表明,直接离散GM(1,1)模型模拟预测精度更高,更能反映高校招
<正>一、课题的提出(一)研究背景:1、数学学科的性质使培养学生应用数学成为必要。首先,数学的根本出发点并不是人类思维而是实践,数学是人们为了解决人类生活中的实际问题而
会议
社会化是社会成员在社会生活中通过学习和实践习得已有社会文化的过程,也是社会文化在社会发展进程中传播的过程。大学生社会化是公民社会化的主要内容之一。大学生作为青年群
随着三维建模技术和数值方法的发展,针对三维实体的有限元技术在工程领域得到了越来越广泛的应用。实体网格的生成是三维实体有限元分析的重要前提,六面体网格由于其在计算精度
目的:通过探索新疆地区肾癌患者与健康者之间血清蛋白表达谱的变化,汉族与维吾尔族肾癌患者之间血清蛋白表达谱的变化以及肾癌患者手术治疗前后的血清蛋白表达谱变化,①筛选并建
航天继电器主要应用于国防电子系统中,它的长期工作可靠性直接影响国防系统的可靠性,粘连(熔焊)是航天继电器失效的主要故障之一。本文主要分析四种不同型号航天继电器的可靠性,四
随着社会的发展,环境污染越来越严重,排放法规也越来越严格,解决发动机排气污染,同时提高发动机性能已迫在眉睫。点火提前角直接影响发动机的动力性和经济性,点火提前角过大发动机
日常生活世界是社会科学发展所不容忽视的视阈,马克思主义大众化是理论界研究的热点问题。从日常生活世界出发,探寻马克思主义理论下沉和日常生活上升相结合的合理路径,有利于将
城市商业银行已逐步发展成为继国有商业银行、全国性股份制银行之后的又一生力军,成为我国银行业不可或缺的“第三梯队”。城商行的跨区域经营浪潮从2006年开始,至今已有7个年