基于主动学习的数据流自适应分类方法

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:juezhan2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流中蕴含着丰富的信息,近年来,对数据流的挖掘研究工作越来越多。相比于静态数据,数据流数据有高速、无限、概念漂移、概念演变、少量标签等特点。概念漂移与概念演变会导致数据流分类模型的分类能力随时间发展而下降,这就要求分类模型有自适应的能力。现有的大多数数据流自适应分类模型往往假设数据输入分类模型得到预测标签之后,就可以得到其真实标签。但是,这种假设在某些情况下是不合理的,因为数据标记往往成本高,耗时长。因此,本文针对数据流概念漂移、概念演变、少量标签等场景的数据流自适应分类问题展开了研究工作。首先,针对数据流概念漂移和少量标签问题,论文提出一种用于数据流自适应概念漂移过程的主动学习方法。该方法在考虑主动学习可能出现采样偏差的情况下,结合了不确定性主动学习策略以及边界点和离群点检测方法BOD,利用不确定性样本能够反映决策边界,边界点和离群点能够反映特征空间的优点,使得主动学习的少量标签样本尽可能地反应数据的真实分布。其次,在考虑数据流概念漂移和少量标签问题的基础上,论文加入了对概念演变问题的研究,针对已有分类模型EMC做了如下改进:首先提出了距离加权策略改进了原来的分类策略;然后提出了基于不确定性和随机选择策略的主动学习方法,使模型可以适应少量标签的环境;最后提出了基于样本局部相对密度的新类检测方法NDLRD。NDLRD考虑了新类样本的聚集特征以及新类样本与已有类样本相聚很近的情况,利用局部相对密度衡量样本属于新类的程度。针对第一方面的研究,与已有全标记算法HAT和OBA相比,在概念漂移发生的情况下,本文提出的主动学习方法只需要平均20%左右的标签就可以使分类器保持同等分类精度,说明所提出的主动学习方法有良好的主动学习能力。针对第二方面的研究,在9个真实数据集及合成数据集上进行实验,改进的EMC在大多数数据集上比EMC有更好的实验结果,表明了改进方法的有效性。
其他文献
近年来,随着人口老龄化程度加深,老年认知症的发病率不断提高,已经成为继心血管疾病、恶性肿瘤之后威胁老年人生命健康的第三大疾病。认知症会造成人的心理和行为改变,给患者及其家属带来较大的心理压力和经济负担,给家庭和社会带来一系列严峻问题。抗逆力是人与生俱来的,表现为个人应对危机事件的能力和潜质。抗逆力水平越高,越能够帮助老年人改善情绪,增强自信,正确对待疾病,获取社会支持,积极接受治疗。轻度认知症老年
目标跟踪技术能够在视频序列中对感兴趣目标进行判定、定位以及状态预测,为视频高级语义理解如行为分析等提供支撑,在视频监控、无人驾驶、人机交互、医疗诊断等领域都有广泛
跳频技术是最常用的扩频通信技术之一,跳频通信系统的主要部分是跳频序列(Frequency Hopping Sequence,FHS),其性能是评价跳频通信系统性能的主要指标。因此,通过构造合适的FHS来提高系统的抗干扰、抗截获等性能成为重要研究方向。当FHS的周期很大时,FHS的非周期汉明相关特性则更多地被考虑,而且跳频序列集(Frequency Hopping Sequency set,FHSs
串并联机器人相较于串联机器人,刚度更好、精度更高;相较于并联机器人,工作范围更大、模块化程度更高。串并联机器人凭借这些特点逐渐在机械加工方面有了较强的竞争优势,目前
随着信息时代的到来,世界每时每刻都会产生巨量的图像信息,这种原始的图像往往因为拍摄设备、环境或者存储方面的限制,图像质量过低,往往存在模糊或失真等问题,无法被直接使
得益于计算机计算能力的提高以及大数据的支撑,深度学习展现出其强大的特征学习能力。作为深度学习与目标跟踪相结合的重要方向之一,人脸跟踪已经成为了行业研究热点。在视频
自2013年年初以来,转售价格维持逐渐成为反垄断行政执法的重点对象之一;与此同时,转售价格维持在私人诉讼领域也有突破性的进展,作为全国第一起纵向价格垄断民事诉讼案,锐邦
中国伴随着生态可持续发展政策的推进以及“三农”政策的落实,农户的脆弱性评估是解决“三农”问题的根本。喀斯特地区二元三维水文地质结构遍布,土壤形成速度慢、土壤稳定性
目前全球面临着两大难题,一个是能源危机,另一个就是环境污染问题。其中半导体光催化剂利用太阳能将其转化为化学能是解决这两个问题的有效途径之一。其中二氧化钛(TiO2)作为研
随着人类空间技术的空前飞速发展,在太空中进行各种活动变得越来越频繁,这极大地推动了能够替代宇航员进行舱外操作的空间机器人的技术研究。但是,燃料消耗、载荷未知、外部干扰以及系统内部参数变化等一系列不确定性因素又存在于在太空环境中作业的空间机器人。同时,考虑到空间机器人的柔性因素(如基座弹性和柔性关节)在现实中的影响愈加不可忽视。在此研究背景下,本文针对系统存在内部参数变化、外部干扰以及载荷变化等不确