基于数据流的时间序列异常数据挖掘的研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:pansheng5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于数据流的时间序列异常数据挖掘可以用于交通领域的道路推荐、供水领域的管网监测以及证券、医疗、环保、电力等行业的检测和预报工作。这些领域产生的数据有着明显的时间序列的特征,同时还具有数据量大、结构复杂、实时性要求高等特点。如果仅使用传统的理论和方法分析这些数据,往往因为计算能力、存储能力以及算法的不足而显得无能为力。数据流挖掘理论和技术的引入为解决上述问题提供了新的思路,越来越成为国内外研究者所关注的热点。 目前,时间序列的数据挖掘主要包括相似性查询、分类、聚类和异常检测等。论文围绕数据流环境下时间序列异常数据挖掘这一主题,以时间序列的模式表示为基础,讨论了时间序列数据预处理和压缩存储,提出了一种基于数据流的时间序列异常检测算法,并根据现实生活中多维数据流的需要和对历史数据的分析,将原算法进行了改进,最终确定了改进的基于数据流的时间序列异常检测算法。主要的研究内容和成果包括: 1.时间序列的模式表示论文将解析几何中的线段概念和现实生活中的基本时间窗口引入到时间序列的研究中来,提取线段的斜率作为确定时间序列分段线性表示的分段点选取的依据,提出了一种基于基本窗口和斜率的分段线性表示方法(简称为PLRBWS表示)。时间序列的PLRBWS表示方法简单直观,对于具有明显周期特征和短期模式波动频繁等特点的时间序列具有很强的数据压缩能力,从而能较好地保持时间序列总体模式的变化特征。 2.时间序列的异常检测在时间序列的模式表示基础上,论文提出了基于滑动窗口的时间序列窗口异常的定义,同时给出了流数据环境下的基于滑动窗口的时间序列异常检测算法(简称TOD_SW),采用“窗口异常度”来衡量时间序列上当前窗口的异常程度。与其他异常数据挖算法相比,TODSW不需要训练,满足了数据流的实时性要求,在模式表示的基础上算法又一定程度的降低了存储要求和I/O操作。只要合理地调整参数,算法总是能够及时、有效地检测出当前时间序列的异常行为。
其他文献
移动自组网MANET(Mobile Ad hoc Networks)简称Ad hoc网,是一种新型的无线移动网络,具有易于建网、快速自组、适应性强、成本较低等优点,在军事和商业领域都有广阔的应用前景
手工电弧焊在中国工业生产中应用及为广泛,随着焊接需求的飞速增长,对焊接基础人才培养的需求也日渐增加。而焊工培训主要还是学生在培训基地进行焊接实际操作,即浪费焊接能源,也
细分曲面造型技术已成为图形学领域的一项重要研究内容。它通过定义控制网格和细分规则来表示造型曲面。由于细分曲面具有任意拓扑性、一致性和仿射不变性等优良的性质,因而
随着信息技术和网络技术的不断进步与发展,计算机成为了人类生活必不可少的一种工具。由计算机智能地处理人类语言的技术,即自然语言处理(Natural Language Processing, NLP)
随着计算机性能的提高和网络技术的迅速发展,Internet上汇集了成千上万的计算资源和数据资源,同时,人们也希望更多地进行资源共享、协同工作和联合计算等。P2P(Peer-to-Peer)技
本文研究海事场景的网络视频监控技术,即从网络上获取航段和港区现场的视频图像序列,并进行分析和处理,对用户自定义的监控区域进行实时监控,当监控区域内出现运动目标时能够进行
IP网络电话泛指在以IP为网络层协议的计算机网络中进行话音通信的系统,它采用的技术统称VoIP。VoIP应用凭借技术和成本优势得以在IP网络中迅速发展,但是IP网络缺少服务质量控制
无线自组织网络的便利使得人们越来越关注了,但是正因为自组织网络便利的自组织性使得它比传统的有线网络以及基础建设的无线网络面临着更大的考验。其中,隐藏终端和暴露终端的
计算机仿真为这些问题的解决提供了可行性依据,它是一种可控制的、无破坏性的、耗费小的、并允许多次重复的试验手段,它高效、优质、低廉,是迄今为止最有效的并且经济的综合集成
目前,基于电场敏感原理的ECT二维图像重建只能反映某一时刻管截面的介质分布情况,不能反映两相流流型的变化趋势,因此在功能使用上受到诸多限制。为改变目前这一状况,本文提