基于模型空间的马丁核方法在时间序列分类上的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:sally2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列通常是针对某一统计指标进行采样获得的观测结果,它反映了该统计指标随时间的变化情况。时间序列的特点是数据规模大、数据维度高、连续更新等。随着时间序列数据的不断增长,时间序列分析已经成为一个重要的研究问题。  时间序列分类作为一种重要的时间序列分析方法,目前已被广泛地应用在医疗,经济等各个领域。由于时间序列数据通常是一组观测数值,时间序列分类的难点是不容易提取具有判别性的特征。时间序列核方法针对这个问题有较好的表现。然而,传统的时间序列核方法利用概率生成模型将时间序列转化到模型参数空间进行处理。这种处理方法需要根据领域知识来假设时间序列产生于某一特定的概率生成模型。回声状态网络提供了一种有效的循环神经网络训练方法。这种数据驱动的神经网络不过分依赖关于输入数据的先验知识,而且能够有效地建模时序数据。本文提出了一种基于模型空间的马丁核时间序列分类方法。模型空间方法利用回声状态网络将时间序列转化到模型空间进行处理。因此,模型空间方法避免了传统时间序列核方法关于时间序列生成模型的强假设条件。但是在模型相似度度量阶段,原有的度量方法又需要假设储备池状态的分布情况,这也在一定程度上削弱了这种方法的优势。马丁距离是一种有效的模型相似性度量方式,该方法从模型的行为相似性出发,不需要关注模型的中间状态分布信息。本文的主要工作和贡献如下:  (1)针对传统时间序列核方法需要假定时间序列产生于某一特定概率生成模型的问题,本文利用从非线性特征空间训练得出的线性读出模型表示每一条时间序列。滑动输入窗口使得这种建模方式可以有效地处理变长序列。此外,回声状态网络的强大非线性映射能力也使得该方法可以处理各种类型的时间序列数据。  (2)提出了一种能够在模型空间中有效度量模型相似性的马丁核方法。时间序列的模型表示是一个动力学建模过程,马丁核方法从系统的状态转移矩阵和系统输出矩阵出发,在有效刻画模型相似性的同时还弱化了关于储备池状态分布的强假设条件,将时间序列核方法在普适性上又推进了一步。  (3)合成数据集和标准数据集上的实验结果表明,本文提出的方法在分类准确性、鲁棒性、稳定性等方面均具有较好的表现。
其他文献
随着电子电路领域的飞速发展,计算机的计算能力得到了大幅提升,深度学习神经网络再次迎来了飞速发展的浪潮。全连接神经网络能够处理大规模的数据,提取全部的数据特征,实现大规模
社区问答系统(Community-based Question and Answering System, CQA)通过聚集大众智慧,能够免费提供问题的个性化解决方案,例如Yahoo! Answer,百度知道等。然而CQA系统无显
信息时代中,信息是发展的第一要素,网络的发展让信息的共享成为可能。而信息共享的实质是数据的共享。数据是信息资源最直接的表现形式。这样,为了实现资源的真正共享,在每一
近年来,脑损伤、中风等疾病导致的病人运动障碍、生理残疾等情况越来越多,严重影响了病人的正常生活,给病人及其家庭带来了极大的负担。医学研究表明,手部康复训练对于治疗手
医学图像多相分割与多器官的三维重建在计算机辅助诊断及虚拟手术中有着重要的应用,但由于医学图像本身的复杂性和多样性,经典的图像分割技术无法满足实际需求。本文对平面上
网络上的信息增长和更新速度越来越快,同时存在大量重复的垃圾信息,这些都给人们获取有效信息带来了不便。传统搜索引擎一方面只能返回大量相关网页或文档,另一方面,基于关键
肝脏作为人体内极为重要的解毒器官,近些年来由于生活质量的提高,大量饮酒或饮食不当导致的脂肪肝等病症越来越多,一旦没有得到及时治疗很容易发展成为肝脏肿瘤,所以针对肝部
随着社会科技水平不断提高,身份鉴别的准确性、实用性、安全性等方面受到了人们越来越多的关注,传统的身份识别方法已不满足现实需求。由此,大量学者们一直在致力于寻求一种
基于场景的软件需求建模技术是软件需求工程中被证明最有效和被广泛采用的建模技术之一,但场景建模方法中软件需求描述模糊、不一致问题影响了其使用效果,场景可视化描述可显
半监督学习是机器学习中一个重要的研究领域。半监督学习通过使用少量标记数据并辅助以大量未标记数据进行学习,在尽可能减少人工标注代价的前提下尝试提高学习器的性能。基