基于跨领域的迁移学习算法研究

被引量 : 0次 | 上传用户:mwd2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习技术已经在许多知识工程技术领域包括分类、回归和聚类等取得了重大的成功。但是,许多机器学习技术只有在基于一个共同的假设的情况下才能取得很好的效果,那就是训练数据和测试数据来自于相同的分布和相同的特征空间。而在一般情况下,由于我们的训练数据和测试数据来自不同的领域,这样传统机器学习技术将不能取得很好的效果。如果能够利用一个领域的知识来帮助另外一个领域的学习,即跨领域的迁移学习,将会大大提高机器学习算法的效果。本文首先研究了迁移学习的分类及一些典型的迁移学习算法。再此基础上,提出了两种新的迁移学习算法:(1)提出了一种基于实例KMM匹配的参数迁移学习方法。首先利用KMM算法估计每个源领域实例的权重,然后利用得到的权重,把这些实例应用到基于参数的迁移学习方法中,得到的迁移学习效果要比单独从实例或是从参数出发的迁移学习方法都要好,特别是当目标领域的标记数据比较少时。(2)提出了一种基于KDA的半监督学习迁移算法。利用KDA可以把源领域的数据和目标领域的数据映射到一个相同的低维特征空间使得在一定程度上减小两个领域的数据的分布差异,然后在这个特征空间中利用本文改进的Co-training进行外领域数据的权重更新并得到两个学习器进行学习分类。采用了文档分类领域两著名的数据Reuters221578和20Newsgroup进行实验,实验结果表明本文的迁移学习方法可以获得更好的学习性能。
其他文献
目的探讨分析护理不良事件的原因及解决对策。方法统计2017年1月-2018年12月天津市宁河区医院护理服务中的不良事件,并对其中的护理不良事件原因进行提取分析;采用根本原因分
目的评估非骨水泥型人工全髋关节置换术(THA)术后患者的生活质量。方法对我院1999年1月一2005年3月采用非骨水泥假体行THA患者43例(43髋)进行至少3年(或直至死亡)的随访。所有入选
随着国民经济的提升及国家电力行业的飞速发展,传统的依赖人工到现场抄数的计量电能的方式已经远远不能满足人们的需求,这耗费了大量的人力和物力,严重影响了电能计量管理的工作
随着国民经济的不断壮大,交通运输行业依靠现代信息技术进行管理,以实现专业化、大型化和管理信息网络化的迫切需求也日益增加。而计算机网络技术的广泛应用,则为交通运输行业中
蜂王浆(RJ)是由5-15d工蜂头部营养腺(舌腺和鄂腺)分泌,专供蜂王和3d的幼虫食用的营养物质。蜂王浆的化学成分极为复杂,其中蛋白质是主要营养和功能成分,其含量约占王浆干物质
某船厂管子加工车间产生的废弃物会对地下水产生一定的污染,需评价污染源通过包气带入渗进入潜水含水层的过程及其在潜水含水层中的迁移情况,以及对主要敏感点的影响等,以满
血清胱抑素C(Cystatin C)作为检测肾功能的一种新的内源性标志物,近年来受到临床上的高度重视[1]。它与目前临床上常用的反映肾小球滤过功能(GFR)的指标,如菊粉清除率,同位素
康拉德(1857-1924)被公认为十九世纪末最伟大的英国小说家之一。在进行文学创作之前,他曾经历了二十年的海上生活,因而也成为一位擅长以海上生活作为小说题材的伟大作家,《黑
高血压病是严重危害老年人健康的常见病、多发病,也是引起脑卒中、心力衰竭和肾功能损害的重要危险因素。老年高血压的发病机制与中青年高血压不尽相同,具有单纯收缩期高血压
日本丰田公司创造的"零库存"理论已风靡全球,以其在供应物流环节极大的节约库存成本、解放积压资金的优点而被众多企业所推崇应用。汽车制造作为我国的一项支柱产业,因行业独