基于视觉样本生成的零样本图像分类的研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:laden167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类任务是计算机视觉领域的重点课题,在图像分类的发展过程中,许多模型方法被提出并取得了令人满意的分类准确度。由于热门的分类模型方法都是由大规模的数据驱动的,而在许多实际的场景中缺乏这些数据。因此,零样本学习被提出并成为当今的研究热点。目前很多零样本图像分类方法是采用学习语义信息空间和图像特征空间之间的映射关系来实现图像分类,但是这些方法会在映射的时候产生枢纽化和映射域漂移问题。而且可见类和不可见类之间样本分配不均导致目前很多方法在应对广义零样本任务中表现不佳。基于上述问题,本文提出利用生成模型来解决,主要工作如下:首先提出基于图像特征重构的零样本图像分类模型,利用生成对抗网络将不可见类的语义信息作为条件生成不可见类的图像特征以缓解样本分配不均的问题。同时为了使生成的图像特征更加真实且多样化,在生成器网络上增加一个重构网络,将生成的视觉特征重构回语义信息,并判断它们之间的差距来限制生成器生成更符合语义的图像特征。上一个模型在应对细粒度数据集的效果不理想,因此在上一个模型的基础上引入注意力核化双线性网络。利用注意力机制提升图像特征中重要信息的权重,减少冗余信息的权重,同时核化网络能够获取非线性关系,从而让输出的图像特征更容易被学习。在上述研究的基础上,设计并实现基于视觉样本生成的零样本图像分类系统,将训练好的模型融入系统中,能够实现对图像进行分类、查看不同数据集的分类准确度和查看操作日志等功能。经过对图像分类系统的需求分析,对各个模块进行设计并通过编码和测试,开发出功能完整的图像分类系统。
其他文献
传统的压电式能量收集技术,存在收集方向单一,谐振频率高,转换效率低,输出电压和功率过低的问题。因此本文针对以上问题,提出了一种直角螺旋压电能量收集器和一种圆弧螺旋压电能量收集器。并对这两种螺旋式压电能量收集器进行了数值计算、模型仿真和测试分析。与传统的能量收集器相比,其转换效率,输出电压和功率均可以得到明显改善。本文主要的研究内容如下:(1)介绍了压电能量收集器是把压电能量收集理论作为基础的,运用
学位
量子行走是经典随机行走在量子世界的对应物。基于相干叠加性和量子干涉,量子行走用于实现通用量子计算机、量子通信以及量子模拟。本论文主要讨论离散时间量子行走的基本性质,通过引入量子控制操作实现不同性质行走的相干叠加。通过光学环路结构实现能够精确调控高维量子态的可编程量子行走。主要工作概括如下。量子行走与经典随机行走之间的转变这一研究内容有助于理解量子行走的计算特性,以及与这两种行走相关的动力学。已有的
学位
图像识别技术作为人工智能领域的重要分支,在工农业和公共安全等多个领域被广泛应用。为保证安全生产,降低因作业人员未佩戴安全帽而产生的事故发生率,将图像识别技术应用到安全帽佩戴的实时检查并提高识别准确率,具有显著的工程价值。本文使用卷积神经网络对工作人员是否佩戴安全帽进行检测,主要工作如下:(1)针对在安全帽佩戴检测过程中存在目标较小,检测困难的问题,本文提出了一种基于ASPP(空洞空间金字塔池化)与
学位
移动互联网技术与时空定位技术的快速发展推动了基于位置服务应用的普及。用户基于身份信息与位置信息生成位置证明,并以其为凭证获取位置服务,是当前保证位置服务可靠性的主要方法。传统的位置证明系统采用基于基础设施的位置证明方法,并将位置证明信息在中心化数据库中存储。但是这种方法存在位置证明效率受限于基础设施附近用户分布,以及中心化数据库模式的单点故障问题。本文提出了基于基础设施与附近用户混合的位置证明方法
学位
阵列天线在移动通信、雷达、卫星通信等领域中有着广泛的应用,其中波束赋形是阵列天线的关键技术之一,研究波束赋形技术具有十分重要的意义。近年来,通过智能优化算法针对阵列天线所需的方向图快速实现波束赋形,已经成为研究的热点和重点。本文利用改进粒子群算法实现阵列天线的波束赋形。针对粒子群算法后期搜索能力弱这一问题,本文引入自适应惯性权重以及将粒子群算法与蝴蝶算法相结合这两种思路分别组成了两种不同的改进粒子
学位
Pull Request是GitHub中代码贡献的一种重要方法,当开发人员希望将其代码更改从本地机器合并到存储项目中所有源代码的主存储库时,将提交Pull Request。在将代码更改合并到主存储库之前,开发人员必须请求权限。如果它们的源代码被允许合并,则Pull Request状态显示为被接受。另一方面,如果不允许合并它们的源代码,则Pull Request状态将显示为被拒绝。由于多个因素,例如
学位
频繁子图挖掘是频繁模式挖掘的一种具体形式,广泛应用于社会网络分析、生物技术、推荐系统等领域。然而,图数据集中可能包含一些敏感的信息,在挖掘过程中或发布频繁子图信息时都可能造成隐私的泄露。差分隐私不依赖于第三方所掌握的背景知识,具有严格的理论定义和可量化的隐私保护手段,通过调整隐私预算的大小来控制隐私保护的级别,可以应用于数据挖掘领域。差分隐私技术可以保证查询结果不会因为数据集中任一记录的改变而受到
学位
随着计算机技术与人工智能的快速发展,人脸表情识别技术成为了当前的研究热点,在人机交互、安全驾驶等多个领域有着广泛的应用前景。传统的表情识别技术不仅设计困难,而且不能充分提取表情特征,导致表情识别效果不佳。目前基于深度学习的表情识别技术成为主流方法,但现在的卷积神经网络模型对硬件要求高、训练耗时过长,导致表情识别的实时性难以得到保障,无法部署到低算力的设备上。为了进一步提高表情识别算法的准确率和鲁棒
学位
随着大数据时代互联网中数据体量和规模的飞速增长,我们已可以快速地从各种工具中轻松地获取信息。但是,大多数信息冗杂且无关紧要,用户要花费大量时间剔除无用信息后才能真正的获取到目标内容。所以,使用能够自动提取重要信息的文本处理技术就变得非常重要。本文着眼于文本关系分类和文本生成。关系分类旨在将给定句子中的实体对分类到某个类别中,而文本生成旨在对文本进行分析、内容总结和生成。本文对深度学习和注意力机制在
学位
无轴承开关磁阻电机(BSRM)结构简单、高速性能好、容错性强,该电机在超高速的飞轮储能、航空航天等领域具有巨大应用前景。而转矩与悬浮力间的耦合问题一直是制约该电机发展的重要因素。为此,研究人员提出了具有自解耦功能的宽转子齿无轴承开关磁阻电机(BSRMWR),本文针对实际应用中,该电机位置传感器可能带来的故障隐患与硬件成本高的问题,提出了一种基于高频脉冲注入的无轴承开关磁阻电机的优化控制方法。首先,
学位