【摘 要】
:
当前,深度神经网络模型通常由大规模数据驱动,模型训练需要海量的标签数据样本。模型只能识别训练集里出现过的样本类别,无法对训练集里未出现的新颖类进行准确地识别和预测。零样本学习提出的目的是建立能识别训练集里未出现的新颖类的图像识别模型,这使得零样本学习逐渐成为计算机视觉领域的一个研究热点。在最近的研究中,生成式零样本学习利用生成网络结合类的语义特征为新颖类合成视觉特征,提高了模型对未见类的识别能力。
论文部分内容阅读
当前,深度神经网络模型通常由大规模数据驱动,模型训练需要海量的标签数据样本。模型只能识别训练集里出现过的样本类别,无法对训练集里未出现的新颖类进行准确地识别和预测。零样本学习提出的目的是建立能识别训练集里未出现的新颖类的图像识别模型,这使得零样本学习逐渐成为计算机视觉领域的一个研究热点。在最近的研究中,生成式零样本学习利用生成网络结合类的语义特征为新颖类合成视觉特征,提高了模型对未见类的识别能力。至今为止,零样本学习的主要应用在图像分类和图像分割领域,因此本文将对零样本视觉图像的分类与分割领域中现存问题进行分析和研究,并给出相应的解决算法和方案。现有的生成式零样本图像分类领域方法存在如下待解决的问题:(i)原始语义特征是不完全的和弱判别的,直接利用原始语义特征作为生成网络的约束条件,合成的视觉特征缺乏多样性和可分性;(ii)合成视觉特征的生成对抗网络容易遭受模式坍塌的影响导致训练不稳定。针对现有方法存在的问题,本文提出了一种基于语义增强的特征生成网络模型(Augmented Semantic Based Feature Generative Network,ASFGN)。主要工作包括如下方面:本文提出了一种语义增强方法。利用度量学习方法学习更准确的类间关系特征,弥补原始语义特征的不完全性;设计了一个基于判别性视觉信息的特征选择算法去除冗余属性来提高原始语义特征的可判别性。基于增强语义特征,设计了一个生成网络为未见类合成多样和可区分的视觉特征,以提高零样本图像分类模型的泛化性能;为了缓解生成网络的模式坍塌问题,提出一种坍塌缓解损失函数,该损失通过优化噪声向量之间的相似度与其对应合成的视觉特征之间的相似度的比值来提高模型训练的稳定性。现有的生成式零样本图像分割方法存在如下待解决的问题:(i)没有考虑合成视觉特征的语义不一致性,导致合成的视觉特征不能准确反映语义特征所表达的类间关系。(ii)语义特征空间与合成视觉特征空间的流形结构存在差异导致模型性能受限。针对现有方法存在的问题,本文提出了一种基于语义视觉一致约束的分割算法(Semantic-Visual Consistent Constraint Segmentation,SVCCS)。主要工作包括如下方面:SVCCS算法使用语义视觉双向重建模块对语义特征与合成视觉特征进行相互转换,提高语义特征和合成视觉特征的关联度,缓解合成视觉特征的语义不一致性问题;生成模块利用语义视觉双对抗损失函数为未见类合成视觉特征,合成的视觉特征能更好地反映语义特征所表达的类间关系,减小了语义特征空间结构与合成视觉特征空间结构的差异性。本文将ASFGN算法、SVCCS算法分别与当前主流的零样本图像分类与分割算法在标准测试数据集上进行对比分析。实验结果表明,无论是ASFGN算法还是SVCCS算法均优于比较方法。
其他文献
公众参与低碳减排是实现碳达峰、碳中和目标的重要措施。基于计划行为理论和规范激活理论,对1167名公众进行问卷调查,通过偏最小二乘法结构方程模型进行分析,结果发现:公众低碳减排行为受理性和道德的双重驱动,主观规范、知觉行为控制、结果意识、责任归属和个人规范正向影响公众低碳减排行为意向,进而影响公众低碳减排行为;态度与公众低碳减排行为意向之间无显著正向关系,主观规范对行为意向的影响最大。研究结果明晰了
新冠肺炎所带的不确定性,不仅仅增加了企业的生存危机,也导致了企业出现了严重的管理危机、人员危机、服务危机等等。对于服务行业来说,服务是其核心,而服务必不可少的就是与顾客面对面地沟通与交流,而这个过程就难免会遇到顾客不一样的服务需求,这就要求提供服务的一线新生代员工要实时调整服务策略和服务内容来适应顾客的特定服务需求。旅游行业,作为一个需要高接触的面对面服务行业,它每天都会面临着来自各种各样顾客的服
改革开放以来,中国的企业经济取得了令世界瞩目的耀眼成就。但在此过程中,企业对社会不负责任的事件也层出不穷,典型的例子包括但不限于:2008年的三聚氰胺奶粉事件,2011年的瘦肉精事件,2018年的问题疫苗事件,以及2021年的虚假医药广告事件。企业社会责任行为是指企业努力超越自身直接利益和法律义务的、对社会有益的行为。与之相对,企业社会不负责任行为是指企业非法或合法但不道德的行为,它忽略了社会总体
随着社会经济的迅速发展和人们生活水平的提高,汽车的产量逐年增加,道路交通拥堵和交通事故频频发生,于是智能交通系统应运而生。交通标志检测识别作为智能交通系统的重要组成部分,受到国内外学者广泛关注。然而实际道路环境多变且复杂,这给交通标志的检测和识别带来了挑战,因此交通标志的检测与识别研究具有一定的实际意义。充分考虑到各种干扰因素以及对算法实时性要求,本文主要工作如下:针对交通标志这类种类较多、尺寸较
我国水域面积辽阔,近岸浅水水域的探测一直有着较大需求,对水域经济、航运业、灾害预防和环境保护等方面的发展有着重要意义。目前,对浅水水域进行探测的方法有限,尤其是一些地理位置复杂的浅水水域,人工作业方式或无人船的投放与回收都不是很便利,同时其它探测方法也会存在一定的局限性。为探究一种既能适用于一般浅水水域,也能适用于地理位置特殊的浅水水域探测工具,本文参与了一种集垂直起降、水面航行于一体的多旋翼水面
挤压模具结构复杂,在高温、高压、高摩擦的恶劣工作环境下,极易出现局部危险位置的疲劳断裂失效。同时,模具设计及制造耗资耗时,模具寿命的不确定性也严重影响着企业的生产进度和成本。现在已经有很多针对不同机械零部件失效形式的寿命预测方法,但是对于铝型材挤压模具寿命预测模型的研究不多。伴随计算机技术的普及和发展,有限元仿真技术在铝型材挤压生产中已经得到了广泛应用,但是目前的仿真技术在模具方面的应用主要局限于
AlGaN/GaN高电子迁移率晶体管(high electron mobility transistor,HEMT)是现代微波电路的重要器件,AlGaN/GaN HEMT电容模型对准确预测处于微波和毫米波的模拟/数字芯片具有重要的研究意义。目前已有多种AlGaN/GaN HEMT电容模型的建模方法,但是对影响本征电容的物理因素还可以深入探讨,当器件工作在较大的栅极偏置下,势垒层的寄生沟道载流子对本
环氧化物的阴离子开环聚合因效率高、易于操作、分子量和结构可控、分子量分布窄等特点,成为脂肪族聚醚实验室制备和工业生产中最常用的方法。扩大引发剂的范围是丰富聚醚结构和性能的关键策略。本文以酚类化合物代替传统醇类化合物为引发剂,以无金属路易斯酸碱对为催化剂,在室温、本体条件下实施环氧化物的阴离子开环聚合,系统地探究了引发剂的酸性和催化组分的碱性对聚合反应过程的影响。此外,利用催化剂活性的可调节性,在特
无线电能传输相比传统导线电能传输,具有安全性、灵活性和耐用性等特点,在人们的日常生活和工业生产中得到广泛应用。但目前无线电能传输多应用在小功率近距离传输场合,在中功率远距离多介质应用场景的研究较少,且针对无线充电系统自动调谐同时实现稳压输出存在技术空白。本文以磁耦合谐振式无线充电系统设计及其控制策略为研究对象,针对系统的能量传输特性、硬件电路系统和软件控制策略进行重点研究,设计出可应对各种复杂工况