【摘 要】
:
基于大规模数据训练的深度学习算法已在多个任务上取得成功应用。然而,在诸如医疗、军事等特殊领域获取大规模类别均衡的数据十分困难,此外,当新类别出现时,传统深度学习算法无法实时响应,需从头训练才能识别。小样本学习可解决以上问题,它打破传统深度学习的训练定式,无需加入大量新类别数据重新训练,仅通过少量样例就可以让模型泛化到新类别。目前小样本算法已经广泛地应用在计算机视觉、语音、自然语言处理等多个领域中,
论文部分内容阅读
基于大规模数据训练的深度学习算法已在多个任务上取得成功应用。然而,在诸如医疗、军事等特殊领域获取大规模类别均衡的数据十分困难,此外,当新类别出现时,传统深度学习算法无法实时响应,需从头训练才能识别。小样本学习可解决以上问题,它打破传统深度学习的训练定式,无需加入大量新类别数据重新训练,仅通过少量样例就可以让模型泛化到新类别。目前小样本算法已经广泛地应用在计算机视觉、语音、自然语言处理等多个领域中,尤其在图像识别、语音识别、关系抽取等任务上都取得了很好的效果。目前的小样本算法大多数基于单源数据,而小样本任务中有标签的样例有限,这增大了模型的不确定性。如何利用任务内部信息和外部知识等多源信息来指导模型训练,弥补支持集所含信息以及训练数据不足的问题是当前值得关注的重点,同时,依然存在很多亟待解决的问题。第一,目前的工作大多利用卷积神经网络抽取特征,而无法很好地捕捉样例内部以及样例与当前任务之间的长期依赖性,没有充分利用任务内部的信息来提升模型的自适应性。第二,小样本任务中有标签数据较少,所含信息不足以支撑模型完成像细粒度分类等较难识别任务。嵌入外部知识可以解决上述问题,并且可以提高小样本模型的可靠性,但如何克服外部知识和当前样例之间的语义鸿沟是一个值得研究的问题。第三,人们通常在社交媒体上使用图像、文本、视频等多模态信息来表达观点,而目前的算法中主要关注图像中的对象等较底层的语义信息,而忽略了情感类的语义信息。设定新型多模态小样本任务具有实际应用价值。第四,尽管外部知识等多模态信息方便获取,但在在线应用中,很难实时地为每一个样例提供相关且高质量的多模态信息。如何只在训练过程中嵌入外部知识,而在测试应用阶段不嵌入任何知识非常值得关注。针对上述问题,本文研究基于多源信息的小样本算法,利用单模态、多模态以及跨模态信息提升模型在小样本分类任务上的性能。本文的主要贡献总结如下:(1)基于上下文感知信息的小样本分类算法研究。为了让小样本算法可以针对不同的查询对象关注相同样例的不同区域,本文提出交叉非局部神经网络动态地捕捉样例和相关任务的长期依赖性,提取上下文感知的多尺度信息,充分利用任务内部单模态信息,从多个角度理解当前任务提升模型的自适应性。此外,本文提出基于互信息的约束用来防止特征重组过程中的信息丢失,并提出基于任务的缩放因子处理多尺度特征。(2)基于外部知识的细粒度小样本分类算法研究。为了弥补支持集所含信息不足的问题,本文提出使用样例相关的外部知识做特征增强。由于文本化的外部知识和图像之间存在语义鸿沟,本文提出镜像映射网络,从两个方向将图像特征和知识特征映射到同一语义空间。在小样本算法中嵌入多模态信息可提升模型的可靠性,让其可以完成细粒度分类等较难识别的任务。(3)多模态小样本算法研究。为提升小样本算法的实用性,本文提出一种多模态小样本任务。让模型通过少量图像-文本对来识别视觉概念,任务目的为同时识别出样例中包含的对象和该样例表达的情感。此外,本文提出基于低秩多模态特征融合、多视图度量函数等模块的解决方案。为了验证方法的有效性,本文构建一个大规模多模态小样本数据集,涵盖7个领域的90个视觉概念,共27K个多模态数据。(4)跨模态知识蒸馏算法研究。为了克服在线应用中不能实时为样例提供相关外部知识这一问题,本文提出基于空间关系损失的跨模态知识蒸馏框架,仅在训练过程中利用外部知识。该算法与模型无关,方便嵌入到多种小样本算法中,利用跨模态信息可提升模型在多种小样本分类任务的性能。
其他文献
生物多样性的分布格局及其维持机制是生态学和生物地理学研究的核心问题。学者们针对不同尺度的生态与进化过程如何构建植物群落多样性已开展了很多研究,但区域过程对局域群落构建的影响常被忽略。综合考虑区域和局域过程的共同作用对深入理解群落生物多样性维持机制具有重要意义。为厘清区域和局域过程在植物群落构建中的重要性,本研究以我国亚热带和热带植被数据集为基础,以2960个森林群落乔木层的3307个木本植物物种为
近年来,有机-无机杂化钙钛矿太阳能电池光电转换效率发展迅速,其效率已超过25%,展现了极好的应用前景,但其仍面临着诸如在空气中极易衰减和热稳定性不佳等问题。这些问题主要是对界面电子传输和钙钛矿材料的物理性质研究不够彻底而产生的。本论文主要是围绕高效的电子传输材料以及对钙钛矿吸收层的调控等方面展开,在提高钙钛矿器件效率的同时,改善了器件的稳定性。本文主要的创新性成果如下:1.采用磁控溅射法和旋涂法采
导波具有传播距离远、损伤敏感性高、适合隐蔽损伤监测等优点,是一种很有发展潜力的结构健康监测技术。多模态和频散现象是导波技术走向工程应用的主要制约因素,目前导波技术仍主要应用在多模态和频散相对轻微和容易控制的板状、薄壁管状和杆状结构中,而土木工程结构更加复杂,严重的多模态和频散现象带来的挑战将更加严峻。本文为了发展适用于土木工程健康监测的导波技术,聚焦于解决导波多模态和频散现象在导波数值模拟、导波与
不对称金属催化作为高效构建手性化合物的合成方法而成为化学家们研究的热门领域,其中手性配体是反应立体选择性控制的关键点。本课题组基于手性叔丁基亚磺酰胺构建了不同骨架的新型手性膦配体Sadphos(Sulfinamide phosphine),并在不对称有机小分子催化和过渡金属催化的不对称反应中表现优异。本文基于本组发展的Sadphos“配体库”,为进一步扩大其在不对称金属催化中的应用范围,主要做了以
海洋中塑料垃圾的持续累积及其潜在负面生态风险,使其成为了全人类共同瞩目的重大环境问题。为实施有效的管控政策则需要我们对于海洋微塑料源汇过程有着较好的了解,尤其是对于其排放源头和入海路径。然而,尽管已有研究估算了近80%的塑料垃圾可归结于陆源输入,但是对于其迁移途径方面大多聚焦于地表径流(入海河口)、沿海排放和海上生产活动,忽视了大气沉降对于海洋微塑料污染的潜在重要贡献。为进一步厘清大气微塑料来源,
随着电子器件不断微型化,电子学领域的发展面临着越来越严峻的挑战。开发性质优于传统硅基半导体材料的下一代新型低维半导体材料迫在眉睫。碳基纳米材料具有较强的机械强度和较高的载流子迁移率等独特的物理化学性质,在电子器件等领域具有广阔的应用前景。已有的碳基材料如石墨烯,碳纳米管等在碳基电子的发展中都面临着不同的技术挑战。最近,具有碳氮有序结构的二维C3N的成功合成为碳基纳米材料在纳米光电子器件方面的应用提
随着近几年遥感技术的快速发展,越来越多的卫星可以为人类提供丰富的遥感数据。这些数据经过处理可以应用于军事、农业、工业等有关国计民生的多个领域,并发挥重要作用。另一方面,由于传感器的种类日益丰富,多源遥感数据数量日益增加,如何有效融合多源遥感数据的互补信息去除冗余信息逐渐成为遥感领域的研究热点。遥感图像信息融合可以丰富图像的信息,有助于后续图像理解和解译任务,提高决策置信度,具有重要研究意义。由于物
激光干涉测量技术在位移、距离和零件形貌测量方面具有最高的测量精度,广泛应用于航空航天、汽车制造、半导体制造等领域。激光干涉仪可实现远距离合作目标的高精度位移与距离测量,或在极短距离范围内实现非合作目标的形貌检测。然而,对远距离非合作目标的距离测量或在大尺寸非合作目标形貌测量中,激光干涉仪受限于探测灵敏度,无法发挥作用。本文针对以上问题,开展了高灵敏激光干涉的距离测量技术研究,利用单光子探测器研制了
长江口滨海湿地作为我国典型的潮滩型湿地资源,具有重要生态价值。该湿地主要本地物种芦苇(Phragmites australis)长期面临外来物种互花米草(Spartina alterniflora)入侵而引发的面积减少、功能退化等威胁。芦苇、互花米草混合生长区是外来物种入侵与本地物种保护的关键区域,管理者和生态学家迫切需要了解两物种在该区域的生长状况,以科学评估互花米草的入侵能力,采取适当的针对本