基于联合学习与知识迁移的开放集图像分类研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:daliangengbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能领域神经网络的发展,如何获得大量带标注的数据已经成为关键性问题之一。然而目前只能通过人工标注来获取带标注数据,不仅费时费力,标注的质量也难以得到保障。无监督域自适应就是一种研究如何将源域上已有的大量标注信息迁移到无标注的目标域上的技术。而开放集域自适应(Open Set Domain Adaptation,OSDA)作为域自适应的一种特殊场景,区别于传统的闭合集域自适应设定,开放集域自适应研究如何在目标域可能包含源域中没有出现过的类别的情景下更好地完成迁移。由于源域和目标域样本类别信息的差异性,显然这是更贴近实际并且更具有挑战性的任务。针对迁移过程中源域样本可能对目标域特征的学习造成干扰的问题,本文提出了一种基于域对抗网络与专有网络的知识交换模型(Knowledge Exchange model,Know Ex)。该模型包含两个互补的网络:(1)域对抗网络用于学习具有域不变性的特征,通过源域上的监督信息来推断目标域样本的类别信息;(2)专有网络专注于区分目标域样本来自于已知类或是未知类。两个网络通过联合学习为彼此提供互补的信息,从而在知识交换的过程中两个网络的性能都能得到提升。特别地,该模型还引入了一个适应层用以解决专有网络在联合训练过程中部分预测结果不可靠的问题。针对迁移过程中目标域未知类样本与已知类样本之间的类别不平衡导致决策边界模糊的问题,本文提出了一种基于相互学习的知识迁移开放集域自适应模型(Mutual Learning-based Dual Knowledge Transfer model,ML-DKT)。该模型包含一个跨域网络和一个目标域特有网络。跨域网络通过利用源域样本的标注信息进行训练,并用以推断目标域样本的标注信息。在目标域特有网络上,该模型引入了一个增强分类头部和一个基于语义的对比损失正则项,从而使特有网络在学习目标域已知类样本特征的过程中,能更有效地将未知类样本区分出来。通过两个网络的相互学习与知识迁移过程来同时提升二者的性能。在多个开放集域自适应基准数据集上进行了广泛的实验,验证了本文所提出的模型的有效性。
其他文献
随着中国城镇化进程不断推进,城市道路范围不断外扩,城郊公路面临着从公路功能向市政道路功能转变的需求,公路市政化改造势在必行,但目前还没有相应规范指导改造工程实施,这是公路市政化改造工程亟需解决的问题。本文首先明确公路市政化改造工程的涵义,通过对改造工程的车型分布、交通需求和未来趋势进行分析,基于城镇化率和迭代约束对传统交通量预测四阶段法进行优化,进而确定公路市政化改造工程的道路分级和设计速度等几何
金属增材制造,又称3D打印,是一类在航空航天、生物医学和汽车制造等工业领域具有广泛应用价值的先进技术。其独特的逐层建造金属零件的特点,可极大提高设计自由度和制造灵活性,从而实现具有复杂的几何形状零件的快速制造。然而现有合金因其成形过程中容易产生柱状晶粒和周期性裂纹缺陷,使其难于直接应用于增材制造。目前在增材制造过程中引入金属凝固成核剂是解决这些缺陷的一个有效途径。TiC颗粒因其熔点高、弹性模量大、
面对当前社会所面临的严峻能源与环境问题,燃料电池和锂离子电池作为一种清洁且高效的能量转化与存储装置越来越被受到重视,而其中的电解质材料是电池的核心部件,获得性能优异的电解质材料一直是研究者们致力追求的目标。固态电解质材料相比于传统的液态电解质材料因其化学稳定性好、安全性高等优点备受关注,而现有市售的固态电解质材料需要在较为温和的环境中才能实现较好的性能,一定程度上限制了其在电池中的应用。使用无机填
自适应输出调节问题一直都是控制理论领域非常重要的研究课题,其研究目标是设计一个输出反馈控制器,使得闭环系统稳定的同时,系统输出能渐近跟踪上给定参考信号。传统的二次型Lyapunov函数技术可以很好地解决自适应输出调节问题,但无法保证系统的暂态性能。时变障碍Lyapunov函数是一种采用系统输出跟踪误差和时变误差约束函数来构造Lyapunov函数的新技术,可以有效解决输出受限的非线性系统的输出调节问
随着交通事业的发展,道路交通事故形势愈发严峻,对人民的生命财产安全造成了巨大损失。智能网联汽车可以承担部分或全部驾驶任务,提高行车安全性。其中,可行驶区域辨识技术可检测出当前车辆可行驶的道路区域,以确保在道路上安全行驶,是智能网联汽车环境感知的基础性研究工作。因此,研究智能网联汽车的可行驶区域辨识技术,对于提高交通安全有着重要意义。随着人工智能技术的高速发展,其与智能网联汽车深度融合,迅速成为研究
高热导率绝缘高分子材料是解决电子器件体积持续缩小与及时散热之间矛盾的最佳方案。进一步赋予导热高分子基复合材料可循环回收利用功能将有利于降低成本、保护环境及维持其可持续发展。为此,本文采用多聚甲醛(PFA)和含有芳香酰胺特殊结构的4,4’-二氨基苯酰替苯胺(DABA)为原料,通过利用分子链间氢键强相互作用向树脂固化网络中引入局域微观有序结构增大声子传播自由程,合成一类新型本征导热聚六氢三嗪热固性树脂
姜在我国具有悠久的使用历史,是药食同源的代表,其中姜酚(Gingerols,GRs)是其主要的活性成分,具有广泛的生理活性和药理性能。目前关于姜酚的研究主要集中在其生物活性方面,但关于其高效提取、纯化制备和其运送体系构建的研究较少。为了姜酚更好的开发利用,本文采用非热的脉冲电场技术(Pulsed electric field,PEF)对姜酚提取过程进行优化,从而获得更高的收率和更好的提取物质量,并
情绪是人的多种感觉、思想和行为综合产生的心理和生理状态,在人类社交活动中扮演着非常重要的角色。情绪的诱发和识别是情绪研究领域中的一大热点,其在游戏设计、心理治疗、健康监测和心理学研究等领域都有重要的应用和研究价值。虚拟现实场景沉浸感强且维度较高,将其应用于情绪诱发领域获得了广泛的研究与关注。目前,基于虚拟现实场景的情绪诱发和识别研究中存在着以下问题:(1)现有的情绪诱发方法包括视觉刺激、声音、嗅觉
在股票价格模型的研究中,经典的是Black-Scholes期权定价模型,该模型假设股票价格服从几何布朗运动。然而实证研究显示股票价格收益分布具有自相似性、长期记忆性、非平稳增量以及高峰、厚尾等特征。基于双分数布朗运动和分数泊松过程,本文提出了双分数泊松过程。双分数泊松过程与双分数布朗运动有相同的协方差函数,但其分布具有高峰特征,并且双分数泊松过程具有广义自相似性及长期记忆性。本文首先给出了双分数泊
随着智能采集设备、移动互联网及云存储平台的广泛应用,语音数据爆炸式增长。由于人工标注成本昂贵,经过人工准确标注的语音数据却较少。如何对海量无标签语音进行说话人聚类(Speaker Clustering)、如何对少量带标签语音进行说话人辨识(Speaker Identification)是目前智能语音处理领域的研究热点。本文探讨基于深度卷积网络的说话人聚类与辨识问题。论文主要工作及贡献如下:(1)提