图像识别的无监督域适应方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:JustFelling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络(Deep Neural Network,DNN)在各种机器学习任务中获得了巨大的成功。然而其效果在很大程度上依赖于大量标记好的训练数据。在实际问题中,手动标注充足的训练数据通常会耗费大量时间和费用。同时,传统深度学习的另一个缺点是由于域差异问题,而无法泛化到新数据集。域适应(Domain Adaptation,DA)通过利用标签丰富的源域知识来帮助相关但标签稀缺的目标域来解决这个问题,例如对于语义分割这种需要细粒度标注的任务,可以借助于游戏引擎来方便快捷地生成大量带标注的图像,从而辅助真实场景中的语义分割任务。本文主要关注无监督域适应问题,即给定一个源域和一个目标域,源域具有充足的图像和标注信息,而目标域只有图像没有标注,希望获得在目标域上有良好性能的模型。本文考虑了图像分类、图像语义分割和图像目标检测三个基本的计算机视觉任务,根据实际应用场景和任务的不同,分析了存在的挑战性问题,提出了具有针对性的域适应学习方法。本文的主要研究工作和贡献可概括如下:·围绕语义分割任务中的域适应问题,提出了融合低层领域判别器和高层领域判别器的联合对抗学习方法。对于语义分割这样具有结构化输出的任务,通常使用概率空间的领域对抗学习。本文首先提出了一种联合对抗学习方法,通过从低层特征对应的领域判别器引入到高层特征来提升输出空间中的领域对抗学习,然后提出了一个权重迁移模块来减轻解码器对源域的过拟合。具体来说,权重转移模块将原始解码器更改为新的解码器,该解码器仅在对抗损失的监督下学习,因此主要侧重于减少域差异。在两个标准的迁移设置下进行的实验表明,本文方法可以在不同的基线方法上带来明显的性能提升,证明了本文方法在输出空间领域对抗学习的有效性。·围绕目标检测任务中的域适应问题,提出了针对RPN网络的基于类别原型的跨域对齐方法。当前,大多数现有的目标检测域适应方法主要在骨干网络或实例分类器上采用特征对齐来增加检测模型的可迁移性。不同于此,本文首先指出RPN中存在领域差异问题,基于此,提出在RPN阶段进行特征对齐,以便可以有效地区分目标域中的前景和背景候选框。具体来说,首先构建一组可学习的RPN类别原型,然后强制RPN特征与源域和目标域的原型保持一致。其次,采用Grad CAM来找到前景建议中的判别区域,并在RPN特征和原型对齐时,以空间加权的方式增加RPN特征的判别性。本文在多个跨域检测场景进行了实验,结果表明本文所提方法相对于当前最先进方法的有效性。·围绕图像分类任务的域适应问题,提出了基于目标域低置信度样本的实例区分的对比学习方法。当前探索目标域分布的域适应学习方法大部分依赖于高置信度的样本来构建可靠的伪标签、类别原型或者聚类中心,以这种方式表示目标数据结构会忽略大量的低置信度样本,导致次优的可迁移性,因为高置信度样本一般更偏向于源域。为了克服这个问题,本文提出了一种针对低置信度样本的对比学习方法来利用目标数据的完整结构。首先,提出使用低置信度样本构建正负样本对可以更好地避免语义冲突问题,然后用分类器权重重新表示原始特征,这样可以缓解学习到的特征分布和任务判别能力的不一致性。其次,将跨域Mixup与提出的对比损失相结合,以进一步减小跨域差距。最后,在标准的无监督和半监督域适应任务设置上的结果表明,本文的方法是有效的并且达到了当前最好的性能。总结起来,本文针对不同视觉任务中的域适应问题,进行了深入探索和研究,结合实际问题的具体特性,从输出空间的领域对抗学习、RPN网络的类别特征跨域对齐和目标域特征分布的学习等角度入手,提出了具有创新性的解决方案。本文涉及到了从虚拟到真实、不同天气以及不同城市场景等多样化的迁移学习场景,实验结果表明,本文方法在提高CNN模型在不同视觉任务的域适应能力上取得了很好的效果,相较于已有的各类算法取得了明显进步,进一步减少CNN模型对于标注信息的依赖,提高了模型在真实场景下的泛化能力,展示了在自动驾驶、工业4.0和智慧城市等实际应用中的价值。
其他文献
学位
为研究GNSS/INS组合导航中松组合和紧组合方式对隧道车载三维激光扫描中载体定位定姿的影响,本文分别采用紧组合和松组合模式对隧道车载三维激光扫描系统采集的导航信息进行处理,分析2种组合方式在隧道中的载体定位定姿性能,并对2种组合方式对后续点云数据处理性能的影响进行了对比分析。结果表明,紧组合方式在定位定姿精度方面优于松组合。同时,在后续点云数据处理中,2种组合方式得到的点云数据点位误差RMS值都
目的 评估腰椎滑脱的斜外侧椎间融合术(OLIF)入路影像解剖学特点。方法 将40例门诊腰痛行腰椎MRI检查的患者按照是否存在腰椎滑脱分为腰椎滑脱组(均确诊为L4椎体Ⅰ~Ⅱ度退变性滑脱,20例)和非腰椎滑脱组(20例)。在腰椎MRI的L4~5椎间隙中央层轴位T2加权像上辨识左侧腰大肌、左侧腹主动脉、左侧腰交感干、节段动脉等解剖结构,并分析OLIF入路下相关解剖学参数的关系。结果 L4椎体OLIF入路
学位
经济的高速发展下,人们的平均寿命不断增加,人口老龄化趋势越来越明显,医疗行业迅速发展成为全球经济发展领域中最具活力的领域之一。近些年来,全球医疗器械产业持续增长,市场规模不断增大,Evaluate Med Tech统计结果显示,截止2021年年底,了全球医疗器械市场份额高达5043亿美元,预计2024年其市场份额将达到5945亿元,并在未来几年持续增长,涨幅将达到5.6%。根据BCG波士顿咨询的分
癫痫是一种常见的神经系统的慢性疾病,是一种神经元高度异常同步放电所导致神经功能障碍的脑部疾病,并累及多个脑功能系统,具有鲜明的大脑网络异常的表现,癫痫网络参与癫痫疾病的产生和传播,与多维度的临床特征密切关。目前对癫痫发生发展机制的理解已经弱化了癫痫的“局灶性”属性,突出了癫痫疾病的网络属性,强调癫痫是起源于局部脑网络的异常放电,并动态向其他脑区播散的神经系统疾病,并认为癫痫脑网络实际上是功能和结构
低频地震和超低频地震都被认为是不同于普通地震的慢地震事件。它们主要发生在俯冲带地区,被认为是慢滑引起的局部加速地震事件。作为最小的慢地震,低频地震是一系列重复发生的小地震,被认为是震颤的组成部分。与同震级的普通地震相比,低频地震的震源持续时间更长,应力降和滑移率更小。而超低频地震则较低频地震的主频更低,震源持续时间更长。与类似震级的普通地震相比,超低频地震具有更长的震源持续时间和更小的应力降,但缺
美国的家庭教育指导师职业自20世纪80年代出现以来日趋成熟完善,本文对其产生背景、申请资格与认证要求、服务机构与工作方式、专业化发展等方面进行了介绍,并结合我国“全面三孩”政策下家庭教育的现状分析对我国家庭教育的启示:为家庭提供及时且精准的家庭教育指导;转变家庭传统教育观念,提升当代家庭育儿功能;完善申请资格与认证体系,培养家庭教育指导人才。
伴随着居民物质生活质量的不断提升,居民对于医疗卫生质量的要求也在最近几年间大幅上升。在这样的背景下,很多医疗机构无法满足居民的实际需求,就会产生一些医患矛盾关系,特别是在最近几年间,这种问题已经发展成为了一个严重的社会问题。从全国的角度来看,从2011年至2020年,中国消费者协会给出的数据显示,在这十年的时间里,来自患者的书面投诉总数上涨了20多倍,这样的数据表明,伴随着居民对于医疗卫生水平要求
目的 对新医改10年后我国卫生费用现状进行评价,并对“十四五”期间卫生费用情况进行预测,为我国卫生费用政策调整提供依据。方法 对2010-2019年卫生费用筹资总额、构成、变化趋势等进行现状描述,运用ARIMA模型对“十四五”期间卫生费用筹资水平与结构进行预测。结果 新医改后我国卫生总费用年均增长率为14.17%,其占GDP的比重10年间增加了1.8%。从卫生筹资结构来看,政府占比下降了1.33%