基于域适应的迁移学习方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hnkfxndz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的来临,各种机器学习方法在大数据分析、计算机视觉等领域实践中取得了长足发展。传统的机器学习方法多是假设训练数据与测试数据独立同分布,然而,由于实际应用数据的复杂性,上述假设往往难以成立。因此,分析待测数据的隐藏信息并挖掘相关的已知数据信息成为现代机器学习的研究热点。迁移学习放宽了训练数据与测试数据独立同分布这一约束,旨在利用与目标域数据不同但相关的源域数据辅助完成目标域任务,实现已有知识在领域间的迁移及复用。本文主要针对迁移学习中的域适应问题,从不同方面系统性的进行研究。首先,针对存在单一源域情况,研究如何有效的提取样本特征并选择最佳特征分布对齐方法提升迁移效果。提出一种基于联合度量的对抗域适应模型。利用空洞卷积层设计补充网络联合Res Net50共同提取样本特征,扩大Res Net50的感受野范围,有效的提取样本细节特征与全局特征。同时,考虑样本边缘分布及条件分布,分别设计联合优化方法,有效的对齐不同域间的样本特征分布。实验表明,该模型能够利用单一源域数据辅助无标记的目标域数据良好的完成分类工作。其次,针对现实中存在多个源域情况,研究如何利用多个存在差异的源域更好的解决目标域任务。提出一种基于主特征选择的多源对抗域适应迁移学习模型。模型将特征提取网络分两步骤训练。首先,基于所有源域数据训练域共享特征提取网络,通过设置该网络与特征鉴别器对抗提取有利于样本分类的主特征。然后,基于各个源域与目标域一起训练域共享及域特定特征提取网络。为每个源域搭建分类器,通过设置特征提取网络与各个源域分类器对抗进一步提取样本主特征。同时,考虑到整体域差异的存在,基于每个源域搭建域鉴别器与特征提取网络对抗学习域不变特征。实验表明,该模型能融合多个源域的优势,有效降低杂乱背景对目标域分类的影响。最后,针对源域标签集是目标域标签集的子集,研究如何避免负迁移以更好的完成迁移学习。提出一种基于联合样本分离的开放集对抗域适应模型。将整体模型分三步骤训练。首先,基于源域数据,设定与当前类别平均距离最近的类别样本为负样本,联合当前类别样本训练多二元分类器,增强该分类器的泛化性。然后,提出联合样本分离方法,利用不同的样本选择方法挑选样本对,训练不同的目标域样本类别鉴别器,得到目标域样本属于“未知类”的权重。最终利用所得权重训练域判别器及目标域分类器,对齐域间共有类别样本特征,并将目标域样本准确分类。实验表明,该模型能有效的将域间共有类别样本对齐,降低目标域私有类别带来的负迁移影响。
其他文献
海洋是地球上最大的生态系统,地球表面约71%的面积被海洋覆盖。海洋中蕴含着大量的生物资源,尤其是微生物资源,但目前仍有许多海洋微生物未被发现与挖掘。作为海洋环境的重要组分,微生物不仅具有丰富的物种多样性和出色的环境适应性,还可以通过产生相应的胞外酶使得高分子量有机物降解为能够被转运利用的小分子物质,参与并影响海洋有机物循环过程。而目前还没有对东海及黄海海域原位胞外酶活的详细报道,特别是高分子量底物
学位
糖酵解和三羧酸循环(TCA循环)是生命体核心代谢途径,涉及三种2-酮基羧酸:丙酮酸、草酰乙酸和2-酮基戊二酸。前述2-酮基羧酸在生理状态下可经某些还原酶的作用,转变为相应的2-羟基羧酸:乳酸、苹果酸和2-羟基戊二酸(2-HG)。乳酸的代谢和调控机制在多个生物类群中已有较为详尽的阐释,而关于2-HG和苹果酸的研究相对较少。近年来有研究发现D-2-羟基戊二酸(D-2-HG)的积累常伴随多种癌症发生,被
学位
随着人工智能与移动设备的广泛使用,需要多方协作的应用场景越来越多,因此对分布式机器学习的需求日益增加。然而数据孤岛的出现和隐私意识的增强使得传统的分布式机器学习训练模型的方法正面临着巨大的挑战。在这种新形式下,联邦学习作为一种具有隐私保护能力的分布式机器学习框架应运而生,保证了各个客户端的数据在不出本地的情况下协同训练机器学习模型。但是现有的研究已经证明联邦学习中存在危害数据安全的漏洞,系统内外的
学位
在当前互联网技术快速发展的背景下,信息技术在社会各个领域中的应用越来越深入,数字化、便捷化的趋势愈发明显,云计算、电子商务、社交网络等新型服务模式不断涌现并得到了广泛的发展。但在人们日常生活中,作为经济活动中的重要凭证,传统的纸质发票却存在着易遗失、易伪造、管理成本高以及消耗纸质资源等诸多问题。因此,新兴的电子发票由于其方便快捷、易于管理、安全性高等优点,成为了信息社会背景下的新一代发票形式。在当
学位
减数分裂是真核生物有性生殖的基础,是配子发生(精子和卵子)的必经过程。减数分裂异常是引发人类不孕不育以及出生缺陷的重要原因。但是,减数分裂的机制尚不明晰。因此,深入探究减数分裂的分子机制和调控过程,对于预防出生缺陷和改善人类生殖健康具有重要意义。姊妹染色单体黏着是有丝分裂和减数分裂的关键事件,对保证染色体正确分离至关重要。姊妹染色单体之间的黏着由黏着素介导。黏着素装载复合体则负责将黏着素装载到染色
学位
随着无人机技术的不断发展及其执行任务日益复杂,无人机群协同工作逐渐成为无人机应用的主流。由于无人机网络的开放性导致系统的软硬件漏洞暴露在非安全的环境,且攻击面变大。同时,无人机是一个资源受限的实时嵌入式系统,缺乏对安全性的全面考虑,使得攻击者能够利用相关漏洞修改系统软硬件成功入侵无人机。然而,整个无人机群的安全性和可靠性依赖于单一无人机的安全可信,若某架无人机被黑客攻击并利用,则会导致其它无人机接
学位
随着世界经济全球化以及互联网金融的快速发展,信用风险管理在确保金融机构的稳定运行中扮演着越来越重要的角色。金融业务规模和种类的不断发展,以及参与企业和用户数量的不断提高,导致风险管理在精度和可靠性方面的要求急剧增加。然而,与智能化风险评估需求形成鲜明对比的是,传统用户风险评估方法无法有效应对海量多源异构数据带来的复杂性,存在用户隐私保护机制不够健全,风险判别条件单一,数据流动受限,风险预判困难等诸
学位
近年来,机器学习被广泛应用于在线诊断、金融预测和入侵检测等场景。机器学习主要由数据驱动,为了让没有数据的用户感受到机器学习的便利性,机器学习即服务(MLaaS)模式快速发展。在MLaaS中,服务提供商从其私有数据集中训练预测模型,并为客户端远程使用该模型提供接口。预测模型对于服务提供商来说是非常有价值的私有资产,查询特征和预测结果对于用户来说是敏感的隐私信息。这激发了安全机器学习预测的需求,即服务
学位
随着我国天地一体化信息网络、物联网等复杂网络的逐步推进,其面临的安全威胁也越来越受到技术人员的关注,为了能够进行快速、持续的响应,安全人员不得不应对复杂的操作流程以及匮乏的资源、技能和预算。如果安全人员以手工的方式处理大量警报信息,很容易导致忽略真实且有危害的事件。因此建立一套自动响应、体系成熟、自成闭环的安全防护系统和安全服务能力编排系统是必要的。在天地一体化信息网络、物联网等复杂网络中,各类安
学位
倍半萜类化合物β-榄香烯(β-elemene),是姜科植物温莪术中的主要活性成分,具有广谱的抗癌活性。目前β-榄香烯的生产主要以植物提取和化学合成为主,步骤繁琐且易对环境造成污染。本论文以酿酒酵母工业菌株CEN.PK2-1D为底盘细胞,利用合成生物学相关技术在酿酒酵母中构建β-榄香烯的直接前体物—吉马烯A的高效生产平台。主要研究内容如下:(1)筛选具有高活性的吉马烯A合酶(Germacrene A
学位