【摘 要】
:
图像表征学习借助算法让机器从图像中自动学习有用特征来完成具体的任务,是自动驾驶、视频监控、智能医疗等高价值视觉应用可以普及的重要技术环节。在真实视觉应用场景中,训练数据常具有数据来源多、数据分布差异大等特点,对已有图像表征学习技术提出了诸多挑战。根据数据源的特性及数据使用方式,本文基于以下几个问题,对跨数据分布的图像特征学习进行研究:首先,从数据的语义层面来看,训练数据来自多个具有分布差异(dis
论文部分内容阅读
图像表征学习借助算法让机器从图像中自动学习有用特征来完成具体的任务,是自动驾驶、视频监控、智能医疗等高价值视觉应用可以普及的重要技术环节。在真实视觉应用场景中,训练数据常具有数据来源多、数据分布差异大等特点,对已有图像表征学习技术提出了诸多挑战。根据数据源的特性及数据使用方式,本文基于以下几个问题,对跨数据分布的图像特征学习进行研究:首先,从数据的语义层面来看,训练数据来自多个具有分布差异(distribution gap)的数据领域,各领域数据具有标签一致的特性。不加处理地直接将多领域图像混合训练,不但会因样本间分布差异过大导致深度模型较难收敛,而且由于图像集合数量分布不均衡等因素容易加重深度模型训练时的“灾难性遗忘”(catastrophic forgetting)问题,严重影响模型的泛化性能。其次,从特征层面来看,从不同数据分布特性解释同一个视觉目标可以获得多模态图像,除了标签一致的语义特性,多模态图像常具有逐像素对应的结构相关性。例如RGB-D图像中,深度图像具有对光照变化不敏感、具有更清晰的几何特征等优点,可以很好地对同一视角下的RGB数据进行补充。多模态图像表征学习通常通过分别训练各模态图像特征表达再进行融合实现相关任务。然而,已有方法在学习各模态特征时往往是独立进行的、忽略了多模态图像间的相互联系;缺少对关联性的挖掘往往导致次优的多模态图像表征学习解决方案。此外,跨分布图像常以特权信息(privilege information)的形式存在,即特定分布数据仅在模型训练时可得,在测试时因场景受限等原因无法使用。如何在这种数据不完整的场景下,将特权信息有效特征迁移至目标图像的特征学习、增强模型的特征表达能力,是非常值得探索的研究方向。面对以上跨数据分布的视觉应用场景,本文提出了有针对性的图像特征学习技术进行支持,主要工作和贡献总结为以下几个方面:1.针对训练图像来自多个数据领域、测试图像分布不可知的挑战,本文提出了一种基于跨域门控的领域泛化特征学习技术。该方法以信息论中的“信息瓶颈”理论为依据,利用卷积神经网络对单域、跨域特征表达能力的不同,使用跨域激活的方式定位并剔除与标签预测无关的特征,在训练中激活更多有效特征。该方法缓解了使用多领域数据训练深度模型容易过拟合特定领域数据的问题,提高了模型对各领域数据的泛化能力。此外,我们针对门控机制提出一种层级的模型参数更新策略,平衡了模型训练中冗余信息剔除与多样性特征学习的关系,使模型训练更加稳定高效。我们在三个公开域泛化数据集上进行了综合实验对比分析,实验结果优于现有的最好方法。同时,一系列实验也验证了该特征学习方法对建模领域偏置问题的有效性。2.针对多模态图像具有数据分布差异大、结构关联性强的特点,本文提出了一种基于跨模态特征共享的特征学习技术,将多模态互补信息的探索建模到跨模态图像翻译模型的优化中,利用共享特征空间增强网络的表达能力。在图像翻译过程中,我们设计了具有语义约束的图像生成函数,并引入图像标签,强化了模型对图像内容的理解。同时,模型在训练中可以生成高质量的跨模态图像,对训练数据进行扩增,有效增强了特征学习的效果。我们基于场景识别任务,在两个公开的RGB-D室内场景识别数据集上进行了综合实验对比分析。实验结果表明,本文方法可以有效利用多模态数据间的相互关系,增强多模态网络的表征能力,超过了当前最好方法。3.针对存在跨分布特权信息的图像表征学习场景,本文利用其与目标数据的内容一致性,提出了一种基于对比学习的图像特征增强技术。该方法通过最大化特权信息与目标图像的互信息,将特权信息差异化特征有效迁移至目标图像的特征学习中,增强了模型对目标图像的表征能力。在训练中,我们使用基于GAN网络的图像生成任务对模型进行预训练,使深度对比模型获得更好的初始化参数。同时,我们用图像块代替整幅图像,强化对比学习的采样过程,提升了模型特征学习的效果。我们在场景语义分割任务上对本文方法进行了综合实验对比分析,实验结果表明,本文方法可以有效利用特权信息增强模型对目标数据的表征能力,取得了比已有方法更好的结果。
其他文献
化学是初中阶段非常重要的一门学科,通过教学,教师可以培养学生的科学精神、探究能力和社会责任素养。社会责任感既是《义务教育化学课程标准(2011版)》对化学教学提出的基本要求,也是初中学生形成健康人生观的需要。文章就初中化学课堂如何培养学生的社会责任素养进行了积极的探索,旨在帮助学生形成完善、高尚的人格,实现可持续发展。
如今,人们对在水生环境中广泛使用抗生素存在极大的担忧。这些抗生素在环境中的存在正对抗菌素耐药基因(AMR)构成威胁。尽管目前已经进行了许多详细的研究来降解水中的抗生素,但是抗生素污染问题依旧严峻。因此,在这项研究中,我们采用磺胺二甲恶英(SDM)作为目标抗生素,它是磺酰胺(SA)的一种。由于其对环境和人类健康的不利影响,地表水中残留的磺酰胺类抗生素(如SDM)的存在已成为人们关注的焦点。在我们的研
随着社会经济的发展,越来越多的人患有代谢综合征(Mets)。在美国,有近三分之一的人患有Mets。在中国,Mets患者也在逐年增加。Mets是一类同时患有腹部肥胖、胰岛素抵抗、高血压或高脂血症等症状的非传染性疾病,后续容易发展成2型糖尿病和各种心血管疾病。Mets会严重降低患者的生活质量,一旦发展为心血管疾病,患者的生命还将随时受到威胁。随着患病人群的增加,Mets成为威胁人类的健康的杀手。因此,
大豆花叶病毒(Soybean mosaic virus,SMV)导致的大豆花叶病对大豆的生产构成严重威胁。而近期研究发现,在我国南方多个地区,与SMV亲缘关系较近的菜豆普通花叶病毒(Bean common mosaic virus,BCMV)也可引起田间大豆花叶病的发生。用田间大豆中分离的4个BCMV株系分别接种具有SMV抗性的不同大豆品种后发现,抗SMV品种PI 96983、Ogden、Mars
目前中国已经有了成百上千、甚至更多的公民参与案例研究,这些案例研究从不同的角度对中国公民参与过程进行了描述,极大地丰富了人们对中国公民参与背景、过程的认知。然而,从方法论的角度来说,针对某一特殊事件、又或者聚焦于某一领域的案例研究总是很难被视为总体中的“理想类型”,目前中国公民参与领域中的案例研究绝大多数是以单案例研究为主,这使得整个中国公民参与研究领域依然面临“只见树木不见林”的问题。通过回顾已
20世纪70年代兴起的新文化史是发生在西方历史学文化转向过程中的一个缩影。借助于人类学和文学批评理论方法,新文化史在大众取向、微观取向和叙事取向方面形成了自己的特点。在新文化史的影响下,教育史的研究路径发生了转向:在研究视角上,从上层精英转向普通大众;在考察规模上,从"宏大叙事"转向微观研究;在书写方式上,从历史分析转向历史叙事。
红藻(Rhodophyta)是古老的真核藻类。其中红毛菜纲多细胞红藻(Bangiomorpha pubescens)的化石证据可追溯到12亿年前。红藻与绿色植物(Viridiplantae)以及灰胞藻(Glaucophyta)共同归属于原始色素体类群(Archaeplastida)。在质体起源的内共生假说中,原始色素体类群起源于第一次内共生(Primary endosymbiosis),即蓝细菌被
加强社会主义法治理念教育是我党总结历史经验教训提出的重要命题,是我国建设社会主义法治国家的客观需要,它的理论指南是马克思主义法学,根本目的是推动社会主义现代化的发展。依法治国是治国理政的基本方略,社会主义法治理念教育是推进依法治国的内容之一。党的十八届四中全会强调,依法治国是实现国家治理体系和治理能力现代化的必然要求。党的十九大又提出,要完善中国特色社会主义法治体系。社会主义法治理念教育是全面推进
联合国自然资源委员会将城市地下空间列为新型的自然资源。通过开发利用地下空间可缓解地表土地供应紧张、交通拥堵、环境污染和生态恶化等一系列“城市病”,对城市的可持续发展意义重大。然而,目前有关城市地下空间资源的评价理论和识别表征方法尚不完善,碎片化的开发模式导致资源浪费、资源开发风险和资源开发诱发不良环境效应的问题日益严重。本文以国家国际合作专项和中国地质调查局在第四纪平原区典型城市开展的地下空间资源
高度重视意识形态话语权建设,是我们党一百年来不断取得社会主义革命、建设、改革和复兴事业伟大胜利的宝贵经验。中国共产党的百年奋斗史,也是党不断夺取、完善和夯实马克思主义意识形态话语权的历史。中国共产党的意识形态话语权思想立足于中国特色社会主义伟大实践的基础上,形成了一系列能够指导中国革命、建设、改革和复兴等不同历史实践的重要思想和准则。当前,我国正处于异常复杂的意识形态互动及意识形态话语转型过程中,