论文部分内容阅读
实时数据流中动态模式的发现与跟踪是对带有时间标记的数据流进行动态分析,发现数据流中有意义的模式并且跟踪模式的变化,这是一种从实时数据流中获取知识的重要方法和技术,具有重要的研究意义和应用价值。本研究采用一种基于衰减窗口技术的实时数据流网格聚类方法,发现实时数据流中的模式,并按照模式快照存储策略保存不同时刻的模式快照,通过当前模式与模式快照的匹配对比分析,准确定位和描述数据流模式的变化,实现跟踪模式演化过程的目的。在模式发现和跟踪算法的实现中,利用密度维度树的数据结构构建模式特征树,保存和重构数据流中已经发现的模式,并结合剪枝策略和模式快照存储策略自适应存储模式特征树快照,以实现降低算法的时空消耗并且提高模式发现与跟踪的效率。基于模拟数据集和真实数据集的实验结果表明,本研究所提出的数据流动态模式发现与跟踪算法能够有效地发现与跟踪数据流中的动态模式,并且内存消耗少、处理速度快,具有较高的实用价值。