论文部分内容阅读
时间序列通常是针对某一统计指标进行采样获得的观测结果,它反映了该统计指标随时间的变化情况。时间序列的特点是数据规模大、数据维度高、连续更新等。随着时间序列数据的不断增长,时间序列分析已经成为一个重要的研究问题。 时间序列分类作为一种重要的时间序列分析方法,目前已被广泛地应用在医疗,经济等各个领域。由于时间序列数据通常是一组观测数值,时间序列分类的难点是不容易提取具有判别性的特征。时间序列核方法针对这个问题有较好的表现。然而,传统的时间序列核方法利用概率生成模型将时间序列转化到模型参数空间进行处理。这种处理方法需要根据领域知识来假设时间序列产生于某一特定的概率生成模型。回声状态网络提供了一种有效的循环神经网络训练方法。这种数据驱动的神经网络不过分依赖关于输入数据的先验知识,而且能够有效地建模时序数据。本文提出了一种基于模型空间的马丁核时间序列分类方法。模型空间方法利用回声状态网络将时间序列转化到模型空间进行处理。因此,模型空间方法避免了传统时间序列核方法关于时间序列生成模型的强假设条件。但是在模型相似度度量阶段,原有的度量方法又需要假设储备池状态的分布情况,这也在一定程度上削弱了这种方法的优势。马丁距离是一种有效的模型相似性度量方式,该方法从模型的行为相似性出发,不需要关注模型的中间状态分布信息。本文的主要工作和贡献如下: (1)针对传统时间序列核方法需要假定时间序列产生于某一特定概率生成模型的问题,本文利用从非线性特征空间训练得出的线性读出模型表示每一条时间序列。滑动输入窗口使得这种建模方式可以有效地处理变长序列。此外,回声状态网络的强大非线性映射能力也使得该方法可以处理各种类型的时间序列数据。 (2)提出了一种能够在模型空间中有效度量模型相似性的马丁核方法。时间序列的模型表示是一个动力学建模过程,马丁核方法从系统的状态转移矩阵和系统输出矩阵出发,在有效刻画模型相似性的同时还弱化了关于储备池状态分布的强假设条件,将时间序列核方法在普适性上又推进了一步。 (3)合成数据集和标准数据集上的实验结果表明,本文提出的方法在分类准确性、鲁棒性、稳定性等方面均具有较好的表现。