基于迁移学习的数据流分类研究

来源 :安徽工程大学 | 被引量 : 0次 | 上传用户:MagicStone2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流分类作为数据挖掘领域中的一个重要分支,能够获取数据流中有价值的信息,已成为当下研究热点之一。数据流具有可变、无限、快速等特征,导致传统的分类方法面临较多难题,如样本标注和概念漂移等。因此,如何建立精确的分类模型以及实时检测概念变化,成为数据流分类面临的挑战。迁移学习利用源领域和目标领域之间的相似性,将知识从源领域迁移到目标领域。基于迁移学习的数据流分类方法能够构建出高效的分类模型,解决数据流分类中的样本标注和概念漂移等问题。因此,开展基于迁移学习的数据流分类研究具有重要的现实意义和研究价值。鉴于此,本文将迁移学习应用于数据流分类中,具体工作如下:1.首先对基于迁移学习的数据流分类技术相关基础知识进行详细的阐述,然后归纳出基于迁移学习的数据流分类常用方法,最后对基于迁移学习的数据流分类技术是如何挑选出最合适的源领域分类器的方法给予介绍。2.当数据流中某个样本的类别过于依靠近邻信息进行决策时,可能会产生错误判断的现象,即伪近邻效应。为有效避免数据流分类中的伪近邻现象,提出一种基于互近邻的多源迁移学习方法。该方法的主要思路是利用互近邻思想挑选出互近邻样本集合,同时计算各源领域分类器对互近邻样本集合的局部分类精度,并将局部分类精度最高的源领域分类器和目标领域分类器进行加权集成。对加权集成分类模型进行仿真实验,结果表明该方法与传统迁移集成方法相比,分类准确率和抗噪稳定性均有显著提高。3.为有效消除不确定分类器对于噪声数据流带来的不利影响,设计一种基于样本确定性的多源迁移学习方法。该方法利用弃权分类器思想强制不确定分类器不进行预测,其核心思想是计算各源领域分类器对目标领域样本的样本确定性值,并将样本确定性值满足当前阈值限制的源领域分类器与目标领域分类器在线集成。仿真实验结果证明所提方法是可行的,分类模型具有较高的分类精度以及较好的稳定性。本文探索不同的源领域分类器选取方法,并用这些方法从源领域分类器集合中挑选出最合适的源领域分类器。所提出的方法能够将源领域有效的知识迁移到目标领域,从而解决数据流中的概念漂移和噪声问题。同时给出现阶段基于迁移学习的数据流分类仍需面临的挑战,并针对这些问题论述基于迁移学习的数据流分类未来的研究趋势。
其他文献
目的:本研究通过问卷调查临床高级中医师群体对中医原创思维的认知现状和应用优势,并探讨影响被调查者产生中医原创思维认知差异和应用优势的相关因素,从更深入专业的角度为中医原创思维的传承与培养提供参考数据和发展建议。方法:(1)数据处理:收集126位临床高级中医师的年龄、性别、学历、职称等基本资料及中医原创思维认知程度和应用优势信息,根据问卷纳排标准进行信息筛选和分值转换并建立数据库。(2)统计学分析方
随着地铁交通的日益发展,地铁广告的投放越来越广泛,成为重要的广告形式。地铁广告作为户外广告媒体的典型代表,和其他广告媒体的特征有很大不同,就地铁广告开展相关研究具有很大意义。首先,本文对地铁广告媒体的相关概念进行阐述,明确说明了地铁广告媒体的基本定义,对地铁广告媒体进行分类,并总结其媒介特征;其次,本文按照地铁乘客的出行目的对广告进行了细分,具体包括:学习与工作出行、学习和工作结束、商务出行、娱乐
“安全城市”和“智慧城市”等理念的提出,推动视频监控技术的高速发展。视频监控技术已经向智慧化、网络化、数字化等方向发展。智慧监控系统,较好的整合模式识别、图像处理、计算机视觉等技术,广泛应用于智慧交通、智慧课堂、濒危动物监测、军事国防安全、商业活动分析、社会公众安全等领域。在大多数的智慧监控系统中,分布式的监控摄像机捕捉现场场景,随后将图像数据发送到数据中心或者服务器进行分析处理。当前,基于云计算
在智慧农业中,田间作业环境障碍物感知是农业机器人田间作业环境下必备的功能。探测工作空间内障碍物信息是农业机器人自主导航、采摘作业、田间除草、环境监测等诸多应用的前提。田间障碍物感知方法多种多样,超声波、毫米波雷达和激光雷达等难以准确识别障碍物数量和种类;单目视觉存在物体图像遮挡问题,不易获取目标深度信息;多目视觉图像匹配过程复杂,耗时长,响应慢;多传感器融合存在算法复杂,计算量大等问题。本文以单个
行政公益诉讼是近几年在学术界讨论较多的话题,在新时代中国特色社会主义的理念指导下,制度的确立意味着我国司法改革的进步。在本文中,我主要运用案例分析法、实证分析法、文献分析法和综合分析法,以“中国裁判文书网”和“北大法宝”两大法律数据库为案件查找来源,以检察机关和公益诉讼为关键词进行检索,对新《行政诉讼法》实施后两年内的案件进行系统分析,总结经验,发现存在的问题,并就相关问题提出自己的见解,能够保证
公共基础设施建设有助于改善国民经济的增长和社会民生,满足人民群众对美好生活的向往,直接关系到到公众的根本利益。习近平总书记指出,基础设施是互联互通的基石,也是国家要进一步发展面临的瓶颈。建设高质量、可持续、抗风险、价格合理、包容可及的基础设施,有利于一个国家充分发挥资源禀赋,更好融入全球供应链、产业链、价值链,实现联动发展。但是由于公共基础设施具有较高的外部性和一定的非竞争性和非排他性特点,是一种
传统的隐喻研究将隐喻视作一种语言现象,并对其构成及修辞功能进行研究。随着20世纪80年代认知语言学的兴起,以及概念隐喻理论的提出,越来越多的研究试图从认知角度对隐喻进行解释。此外,语料库方法的应用则提高了概念隐喻研究的客观性和科学性。然而,以往对概念隐喻的研究多集中在日常语言、新闻、政治演讲等体裁上,对作家的文学作品的研究则相对较少。关于文学作品中隐喻的研究,David Lodge(2004,p.
目的:以横断面调查的方法研究慢性肾脏病(Chronic kidney disease,CKD)不同分期与血瘀证积分之间的联系,掌握血瘀在CKD发展过程中的严重程度及变化规律,分析血瘀证积分与不同理化检测指标间的联系,为中西医结合判断CKD预后及活血法治疗CKD提供客观证据,同时归纳总结车树强教授运用不同活血法治疗CKD的临证诊疗经验。方法:收集天津市中医药研究院附属医院肾病科病房符合纳入标准的CK
目的:比较成人骨性Ⅱ类错(牙合)患者治疗前与行拔牙掩饰性矫治治疗后软硬组织、牙体长轴的变化;探讨行拔牙掩饰性矫治的成人骨性Ⅱ类错(牙合)患者下前牙牙体长轴变化与软硬组织、上前牙牙体长轴变化的相关关系;探讨行拔牙掩饰性矫治的成人骨性Ⅱ类错(牙合)病例治疗前颌骨不调的极限。方法:(1)选取采用拔除四颗前磨牙进行固定矫治器的掩饰性矫治治疗成功的成人骨性Ⅱ类错(牙合)患者24例,男2例,女22例,治疗前平
轮状病毒(Rotavirus,RV)广泛存在于世界范围,是导致幼龄动物和人类腹泻的主要病原之一,对养殖业和人类的健康危害很大。益生菌及其代谢产物作为维护肠道健康的重要成分,具有抑制RV感染的能力,并且在维持肠上皮细胞间的紧密连接、肠组织屏障稳定、保护肠粘膜中发挥重要的作用。为探究干酪乳杆菌(Lactobacillus casei)对A组OSU株猪轮状病毒感染猪肠上皮IPEC-J2细胞和昆明乳鼠小肠