模型空间中的时间序列分类算法及其在不平衡数据上的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:shb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是对动态系统随时间顺序采集到的有序观测值集合,通常具有高维、异质和含噪声等特点。观测值之间在时序上可能存在或长或短的依赖关系,构成特定的时序动态模式,因而不同于一般的向量数据。对于时间序列这样的结构化对象,关键研究问题是(1)如何获得反映动态模式的精简低维表示,使得学习器能够利用具有动态行为的序列数据,(2)如何定义具有判别性的距离度量方式,使得类内距离小而类间距离大。本文提出基于模型空间的时间序列分类方法。该方法为每个时间序列学习函数模型,在函数模型集合张成的空间(称为模型空间)中度量原始数据的距离。最后,分类算法在该空间中进行。本文对模型空间的生成机制及其在不平衡序列数据分类中的应用进行了研究,提出对模型的表示性,分类性和模型复杂度项进行优化生成模型空间,并分析了多个目标之间的关系。考虑到多目标之间的不一致带来的优化困难,采用多目标非支配排序演化算法对三个目标同时进行优化。针对分布不平衡的时间序列分类,基于核学习提出一种核特征空间中的过采样学习算法。本文的主要贡献如下:1.本文提出一种多目标学习方法,同时为时间序列优化精简函数表示、距离度量和模型复杂度。和优化单个目标得到的模型相比,本文方法学习得到的模型表示具有更好的时间序列分类准确度和预测精度。2.作为缓解不平衡分类问题的重要方法之一,传统的过采样方法不能适用于具有时序依赖关系、多变量和变长特性的时间序列。本文提出基于核学习获得时间序列模型的非线性距离度量,并在中心化核特征空间进行过采样的方法。原来线性不可分的数据在非线性的核特征空间中更有可能线性可分,满足了在已有过采样方法中常常被忽视的线性可分假设,所以产生的样本点更符合小类数据的分布,不容易过拟合。3.在标准数据集和人造数据集上的时间序列分类实验表明,本文提出的方法具有更好的分类准确度和鲁棒性。
其他文献
近年来,随着传感器技术,计算机网络和无线通信的快速发展,无线传感器网络已成为重要的研究对象并被广泛应用于医疗、军事、环境监测等众多领域。在环境监测领域,大规模的无线传感器网络通常被部署于无人监管、气候复杂的野外环境中。在长期使用的过程中,传感器网络中的数据经常遇到漂移、丢失等问题。这对于终端用户来说是一个严重的问题,因为在无线传感器网络的环境监测应用中必须使用精准的数据,才能制定科学决策。本文针对
中国道教艺术传承数千年,影响深远,用于日常供奉和斋祭的神仙画像或雕塑传世众多,其中最著名的便是位于山西芮城的永乐宫三清殿内的《朝元图》壁画。《朝元图》是元代壁画艺
图G =(V,E)的强边着色是将多种颜色分配给图G的边集,使得着每一种颜色的边的集合是图G的一个导出匹配;图G的强边色数指的是在图G的所有强边着色中需要的颜色最少的强边着色的
随着互联网的快速发展,病理性游戏使用作为一种行为成瘾得到了广泛的社会关注。现有研究表明,病理性游戏使用不仅可能有损反应抑制等执行功能,也可能导致异常的情绪加工。根
阿尔茨海默症(Alzheimer’s Disease,AD)是老年人最常见的一种认知障碍,严重影响老年人的生活质量,其发展过程的不可逆性使得研究者越来越关注其早期发展阶段。主观认知下降(
我国的西藏地区自然地理风光十分壮丽,藏族有着丰富多彩的文化习俗,这吸引着很多艺术家前往寻找灵感和创作。这些作品大都是以西藏自然景观、藏族人民日常生活、宗教活动等为
“亲亲相隐”,又称亲亲得相首匿,自先秦时起一直是古代中国非常重要的法律制度,影响了中国二千余年的法治进程,但在1949年新中国成立后却遭抛弃。与此同时,发达国家却逐渐重
证人在刑事诉讼中担任诉讼参与人的角色,在刑事案件中起到关键作用,证人证言往往关系到是否可以将犯罪分子绳之以法。但是司法实践中,证人遭受侵害的现象屡屡发生,证人不图回
自由裁量权作为一种较为“灵活”的救济方式,一直受到社会大众的广泛关注。近年来,研究自由裁量权的文章不可谓不多,大都集中在如何规范行政执法自由裁量权的制度性研究。随
Mankiw,Romer&Weil(1992)测试了基础和广义Solow增长模型的有效性。其中,人力资本积累并没有在基本模型中引入为一项解释变量,而引入到了广义模型中。但是,我观察到他们对人