基于聚类动态TrAdaBoost迁移学习分类方法

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:kkyilian2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步和人工智能的发展,科学工作者们越来越重视从海量的数据中提取和分类数据。但是我们在工作的过程中发现,数据集中无标签的数据的数量非常多而有标签的数据非常少。并且在数据的提取分类的过程中,人工标记数据方式非常的耗时,这就限制采用人工标记数据的行为方式,也限制了在实验中带标签数据样本的数量。针对这种情况,迁移学习正好解决数据集缺失的问题。迁移学习可以利用相关领域的大量的未标记过的数据来帮助目标领域中少量的标记数据的学习,在经过最近十几年的发展,各种基于迁移学习的算法被提出,目前已经广泛的应用于机器学习,数据挖掘等其他领域。传统的AdaBoost算法是对特征的权重进行迭代,对于分类正确的,赋予较低的权重值,对于错误分类的,赋予较高的权重值。近年来,人们在AdaBoost算法的基础上提出了基于TrAdaBoost迁移学习算法来解决训练集数据过少的问题。然而在实验的过程中发现,TrAdaBoost算法在迁移的过程中源域的权值会出现两极分化等问题,影响着权重迭代的进行。本文提出了一种基于聚类动态TrAdaBoost迁移学习算法来研究分类的问题,主要的研究内容如下:(1)针对迁移学习过程中的问题,详细的介绍了基于聚类动态TrAdaBoost迁移学习算法,包括其基本思想,训练过程,算法具体的流程以及实验的过程。(2)针对TrAdaBoost算法出现的权值问题,提出通过在迁移学习过程中加入动态因子的方法,在源域的权重更新过程中,根据在目标域中的误差,添加一个动态参数来动态的调整。(3)在迁移学习实施的过程中,源域能够帮助目标域的学习,但是在源域中存在着大量的极不相似的数据,在迁移的过程中,这会极大的干扰分类的精度。考虑到这情况,我们提出通过聚类算法来对源域的数据进行清洗,从而达到提高我们分类的精度的目的。在本文中,我们介绍了聚类动态TrAdaBoost迁移学习算法,我们通过在20Newsgroups数据集上进行实验,来证明本文提出的算法的有效性和可靠性。然后将其与传统的AdaBoost算法和TrAdaBoost算法在数据集中进行比较,证明本算法精确度更高和更具有优越性。
其他文献
债券作为最大的资本市场,在我国发展还存在诸多缺陷和不足,自2014年“11超日债”打破债券零违约之后,最近几年债券违约发生的频率越来越高。到2018年年末,违约债券超过两百只,违约金额近两千亿元,危及大多数类型的所有制公司和多种品种的债券。而2019年到如今三月份,短短的一个季度就已经有7家公司发生债券违约。起初我国债券违约主要出现在私募市场,2016年后公募市场开始出现违约,可见债券违约风险愈演
射孔枪在结构设计后的投产过程中,存在几个典型问题影响着射孔作业的顺利开展,如冲击载荷作用下的螺纹连接问题、射孔枪胀形尺度问题和影响射孔枪强度的盲孔问题。针对上述3
目的:观察发展“快”“慢”两组慢性阻塞性肺病(chronic obstructive pulmonary diseases,COPD)患者一年前后相关炎性因子及中医体质的变化情况,了解两组患者病情发展状况的
活的非可培养(Viable but nonculturable, VBNC)状态作为微生物学的一个全新概念,近二十多年受到了微生物界的极大关注。但是对于VBNC状态致病菌的复苏情况、致病机制等方面
几十年前,韩国在推进工业化和城市化的同时,也面临工农业发展严重失衡的问题。这时,韩国组织实施了新农村建设与发展运动,以此在经济、社会均衡发展和人与自然协调发展方面作
期刊
鸽子的导航能力十分出众,其依靠地磁进行导航的生物机制近年来引起人们的广泛关注,但研究进展较为缓慢。本文针对鸽子在不同条件下的磁导航或磁感应行为,开展了行为学、分子
随着社会的发展和人民生活水平的提高,旅游己经成为人们日常生活不可或缺的一部分,对于高中生来说,对旅游地理知识的实践不仅能够促进自身更深刻的理解旅游,也能让旅游变得更
介绍了一种适用于小井筒的对称式复合射孔 /防砂装置的基本结构和工作原理 ,探讨了该装置的设计原理 ,包括枪管的选用 ,螺纹强度的设计 ,枪内火药燃烧压力的计算等 ,指出了现
本文分析复合射孔技术的现状和存在的问题,通过理论和实验相结合的方法对增效射孔器进行研究。 其主要内容如下: (1)通过对枪身管材的选取、枪身螺纹牙的计算、泄压孔的
<正> 南瓜里含有大量亚麻仁油酸、软脂酸、硬脂酸等甘油酸,均为良质油脂,有降低血压的作用,治疗高血压,可炒南瓜
期刊