深度知识迁移方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lang_tianhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度知识迁移指的是在深度学习中引入人类知识迁移的学习思维,借助辅助域或任务的知识改善目标域或任务的表现。研究深度知识迁移的一个重要意义在于搭建复杂深度学习研究和落地应用之间的桥梁。具体来说,大量的训练数据和复杂精细的神经网络设计是深度学习近年来取得重大进展的两个关键因素。然而在实际应用中,受限于人力、设备等资源成本,深度学习的部署往往将面临训练数据少和部署资源受限两个问题。深度知识迁移,利用大数据集的知识提升小数据上的任务表现,能够缓解训练数据缺乏的问题;挖掘大模型的知识辅助小模型的训练,在资源受限的情况下部署高效模型。研究深度知识迁移主要面临不充分迁移和负迁移两个挑战。相比前者,负迁移的相关研究较少却又十分重要。当实现数据集之间的知识迁移时,若数据集分布差异很大,即领域差异过大,辅助数据集中大量知识与目标任务无关,会产生负迁移问题;当实现模型之间的知识迁移时,若模型的容量差距过大,即任务差异过大,使得目标模型优化困难,产生负迁移问题。本文面向大数据集到小数据集以及大模型到小模型的知识迁移过程中产生的负迁移问题,分析原因并设计针对性解决方案,主要工作如下:(1)针对领域差异大导致的负迁移问题,提出一种基于条件知识增强的知识迁移方法。将目标模型的特征编码成条件信息,基于条件通道注意力模块提取源模型中与目标任务相关的知识;将源模型中的知识作为辅助信息,通过动态残差连接的方式融合辅助信息和目标特征,构建可靠的监督信号,有效缓解无关知识对目标模型的负影响。(2)针对任务差异大导致的负迁移问题,从降低大模型的知识难度出发,提出一种基于深度互学习的知识迁移方法。设计知识桥梁模块,提出半在线训练策略,同时利用传统知识蒸馏方法中的可靠监督信号和深度互学习方法中的网络模仿能力。该方法综合两类主流知识迁移训练策略,有效缓解了模型间能力鸿沟带来的优化困难问题。(3)针对任务差异大导致的负迁移问题,从提高小模型的学习能力出发,提出一种基于对抗协作的知识迁移方法。设计多分支学生模型,引入协作学习的思想共同学习教师模型知识。提出对抗协作模块,同时引入注意力机制和对抗训练的思想,提升学生模型特征表达的鲁棒性和多样性。
其他文献
化学品是人类生活不可缺少的一部分。然而很多化学品由于误用、滥用或处置不当会损害人类健康和自然环境。酚类化合物是很多化学品合成过程的中间体,在自然界中,酚类化合物由于稳定的芳香环特性降解困难,一旦进入人体会引起机体慢性中毒。另外,广泛使用的多孔炭材料也具有潜在风险,尤其作为药物载体,易于在人体内富集,危害人体健康。催化氧化消除是一种利用催化氧化反应降解去除有害物质的技术,在污染物的去除以及复合材料的
学位
随着工业社会的不断发展,温室效应以及能源危机成为了亟待解决的问题,人类急需寻找一种新的可持续能源。光电化学分解水制氢,将氢能源储存并加以利用,是一种解决目前能源问题的有效方法。目前,产氧半反应还是光电化学分解水反应的速控步骤,所以构筑高效、稳定的光阳极对整体光电化学分解水反应是具有决定性作用的。α-Fe2O3因其储量丰富,能带结构优异,理论光电流高(12.5m A/cm~2),被认为是光电化学水氧
学位
MRI图像配准是肿瘤患者整个放射治疗过程中的一个关键环节,该环节旨在将患者接受放射治疗前后两个时期的MRI进行图像配准。医生使用配准好的MRI与放疗后的MRI进行叠加对比,根据对比结果得到患者放射治疗的效果评估,而放疗效果的评估是医生对患者进行下一步医疗决策的基础依据。近年来图像配准的研究已经日益成熟,并从迭代优化的传统配准方法逐步发展到基于神经网络的配准方法。这些方法都是基于单视图数据获取图像间
学位
CBCT生成伪CT任务是实现自适应放射治疗的关键步骤,旨在利用合成的伪CT进行剂量计算,及时修正、调整放射治疗计划。与CT相比,CBCT具有成像快、效率高且辐射剂量相对低的特点,对患者的身体额外损伤程度较小,但CBCT无可靠的电子密度,无法直接提供剂量计算,因此将CBCT合成伪CT在自适应放射治疗中是有必要的。CBCT生成伪CT任务最常用的方法是循环一致性生成对抗网络(Cycle GAN)以及基于
学位
光热治疗是利用外部光源照射光热材料,将光能转化为热能,来抑制细菌生长或是杀死肿瘤细胞的一种治疗方法。近些年,多种金属氧化物和金属硫化物已经被成功地用于光热治疗,它们具有高光热转化效率、优异的光热稳定性、价格低廉以及易合成的优点。SnS2是一种典型的金属硫族半导体,具有六方Cd I2型晶体结构,带隙约为2.2 e V。由于SnS2具有优异的可见光吸收能力,它可以作为可见光驱动的光催化剂,然而,SnS
学位
由于环境敏感性聚合物具有独特的物理和化学特性而被广泛应用,但目前对该聚合物的相行为机制的研究不够深入。基于前期有研究者使用聚丙二醇二缩水甘油醚(PPGDGE)、聚乙二醇二缩水甘油醚(PEGDGE)和乙醇胺(MEA)为主要单体,通过一锅法制备无规共聚物。该聚合物溶液的相变温度过高,不利于后续的研究与应用。因此在这基础上,设计新的合成路线,调整实验配料比,制备出性能良好的环境敏感性聚合物。本实验采用分
学位
磁流变液(MRF)是一种磁响应型智能材料,具有良好的力学性质和可调节性,广泛应用于许多领域。羰基铁(CI)因其饱和磁化强度高,价格低廉成为MRF的首选材料,但CI密度较大,沉降问题严重,商业化应用受限。提高CI基MRF沉降稳定性以及探索沉降稳定性高且磁流变性能优异的其他替代材料成为当前研究重点。各种提高稳定性的方法(如涂层技术、添加剂等)会使磁流变性减弱,同时相应的工艺复杂,成本较高,限制其发展应
学位
表面辅助激光解吸/电离质谱(surface-assisted laser desorption/ionization mass spectrometry,SALDI-MS)是一种软电离分析技术,适用于小分子的痕量分析。为了提高SALDI-MS检测小分子的性能,已经探索了多种基底,包括半导体、碳、金属和复合材料。其中,硅基材料具有独特的光学、电学以及表面化学性质,可以被加工成各种形态可控的结构,且其
学位
氢能是一种高效清洁的二次能源,在实现“碳中和”目标中起重要作用。硫碘循环被认为是未来实现大规模制氢的可行方法,面临的难题之一在于Bunsen反应产物(H2SO4/HI)难以分离,影响下一步反应进行。直接电解Bunsen反应产物是实现H2SO4和HI分离的有效方案,H2SO4/HI作为阳极电解液析出碘单质,H2SO4水溶液作为阴极电解液产生氢气。直接电解Bunsen反应产物的制氢方法既能解决硫碘循环
学位
SLAM是一项机器人通过传感器实现自身定位的同时构建出环境地图的技术,被广泛用于导航、自动驾驶等视觉任务中。视觉SLAM由于传感器成本低这一优势而被关注,目前已经有比较深入的研究。然而,传统的视觉SLAM方法在某些场景下的表现仍不能满足实际需求。其一,传统SLAM方法基于场景静态假设,真实场景中不可避免会存在动态物体,当动态物体占据图像一定比例时,会对定位产生负面影响,导致精度变低甚至系统失效。当
学位