论文部分内容阅读
近几十年来,随着时间序列数据的飞速增加,以及数据挖掘技术在多个领域的广泛应用,时间序列数据的学习得到了越来越多的关注。这些时间序列数据不仅仅包含文本数据,更包含如图像、音频、视频等多媒体数据。快速处理海量的时间序列数据是一个非常困难的任务,快速地从大量的时间序列数据中学习出有价值的信息具有重大的实际意义。 时间序列数据具有维度高、数据量大、持续更新等特点,从数据中学习到的知识是随着时间不断变化的,这导致传统的数据挖掘技术难以适用,在线增量学习方法对于降低时间序列数据学习的时间成本以及存储空间成本是一个更佳的选择。基于时间序列数据的特点,本文提出了一个基于快速动态时间规整的时间序列学习算法——TSLN算法。 本文的主要工作包括: 1.采用快速动态时间规整作为时间序列数据的相似性度量方法。快速动态时间规整可以度量不同维度的时间序列数据之间的相似性,并且具有线性的时间和空间复杂度,大大降低了时间序列数据学习的时间成本。 2.实现了时间序列数据的在线学习。通过每次输入并处理一个时间序列数据,TSLN实现了时间序列数据的在线学习。处理后的数据不需要进行存储保留,大大降低了存储空间的需求。 3.实现了时间序列数据的增量学习。本文采用了一个基于阈值的方法,实现了时间序列数据的增量学习。TSLN自动地从输入时间序列数据学习合适的代表点,并且允许新的代表点的生成。