零样本学习中的细粒度图像分类研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:mhy8348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着大规模图像数据的涌现以及对图像分类任务的细化,为满足越来越复杂的视觉分类任务,卷积神经网络模型得到了快速的发展。然而,现有的图像分类识别算法无法在测试阶段识别训练过程中不存在类别的样本。因此,零样本学习的概念被提出来解决不可见类别样本识别的问题。对于目前提出的零样本学习问题的解决方法,主要是通过引入辅助语义空间,建立视觉与语义之间广泛的映射关系来弥补类别缺失的问题。但是目前的一些工作并没有考虑视觉与语义本身所带有的特性,忽略了视觉空间与语义空间的巨大差异。此外,现有的大部分工作都是使用视觉的所有视觉特征与语义进行映射,这种映射方式使得语义与视觉特征存在大量的非必要映射关系,这使得零样本学习分类的准确性降低。本文提出的方法基于零样本学习的双线性映射基本模型,针对零样本学习分别提出了两种不同的改进方法。通过使用低维嵌入视觉特征的非线性映射与多部位的注意力机制,提高了语义于视觉之间映射的可靠性。在双线性映射的基本模型中,通过预训练的卷积神经网络获得图像的深度卷积特征,并通过人工标注或非监督学习的方式获得语义向量,在视觉特征与语义向量之间学习双线性映射函数。在本文提出的基于视觉低维嵌入的模型中,首先使用预训练卷积模型获得图像的特征向量,然后使用字典学习将特征向量嵌入到低维空间中以减少特征向量中的冗余信息,最后利用集成学习的方式在视觉的低维嵌入与语义向量之间学习多个映射函数,使得其映射方式非线性化,提高了映射结果的可靠性。在提出的基于多部分注意力的模型中,使用目标检测或人工标注的方式获得图像的多个部分区域,去除噪声信息,通过深度模型获得多个部分区域的视觉特征表达,并基于注意力机制使用语义向量对多个部分区域视觉特征进行加权,使得不同的视觉区域对分类的影响差异化。通过理论说明与实验对比,证明了本文提出的两种方法在一定程度上提高了零样本学习的分类准确性。其中,在基于视觉低维嵌入的模型中,通过对三种现有的方法的对比,我们的分类准确度超过了在大部分数据集上的准确度。在基于多部分注意力的模型中,我们在同一个细粒度数据集上与多个目前现有的较新的方法进行了比较,表明我们的方法显著提高了在细粒度数据集的分类准确度。
其他文献
足式机器人是人工智能的重要应用领域,近年来受到了各国研究学者的广泛关注。研究人员在应用各种方法对机器人进行控制时发现,作为重要的反馈信息,本体速度与位置状态的估计
卫星导航接收机的测距误差受很多因素影响,但其中大部分误差通过差分技术和高精度模型可以得到较大程度的消除。多径误差与信号调制方式、接收机软硬件处理算法、天线特性以
近年来,随着移动互联网和物联网产业的蓬勃发展、移动终端数据业务量呈现出爆炸式增长的趋势。为更好的满足增长的业务需求,超密集组网技术通过减小信号传输距离、增强频谱资源的空间复用,成为提升无线网络容量的最有效途径,然而网络密集化在增大容量的同时也存在回程链路压力大等问题。缓存技术应用而生,即利用边缘缓存技术拉近内容与用户间的距离,从而有效地减少了重复内容的传输,缓解回程压力。因此,探究在边缘化缓存对于
随着云计算技术的快速发展和云存储服务器的大量普及,用户开始将本地数据库外包到云存储服务器,以此节省本地存储开销和避免繁琐的本地数据管理维护。由于云服务提供商的不完
将超高频射频识别(Ultrahigh Frequency Radio Frequency Identification,简称UHF RFID)技术的功耗低、速率快、距离远等技术优势和传感技术的模拟被测参量可以精确转换为数
随着在地形测绘、沉降反演、形变检测、植被估计等领域对目标三维(距离-方位-高度)、四维(距离-方位-高度-形变)信息需求的不断增加,传统SAR二维成像已经无法满足应用需求。S
作为传统的无线传感器网络(Wireless Sensor Networks,WSNs)的延伸和拓展,无线多媒体传感器网络(Wireless Multimedia Sensor Networks,WMSNs)如今已大量投入物流工程、环境监测、智慧城市、现代农业等应用领域。由于其能够感知信息量丰富的多媒体信息,其能耗问题也更加严重。而基于电池的有限能量供给严重限制了节点的灵活设计和网络的长期部署,环境
随着信息技术的快速发展,如何对单网络层的多个参数进行优化设置,以达到整个网络结构的最佳状态,给网络优化带来了新的挑战。对网络配置进行即时定位并结合多数据资料的分析能力来实现网络优化,确保参数调整的准确性和快速性,成为现阶段无线网络优化的发展趋势。在此背景下,本文对小区自动寻优(Automatic Cell Planning,ACP)技术进行了研究,利用ACP技术进行深度网络优化。论文的主要工作如下
近年来,机器人技术的发展在很多领域都引起了巨大的变革。以医疗领域为例,机器人技术在该领域发挥着越来越重要的作用。如今,机器人已开始和外科医生一起进行手术操作,包括微创手术等其他领域。机器人辅助微创手术不仅可以提高手术的准确性,使以前不能手术的手术成为可能,而且可以降低人为因素导致手术失败的风险,减少医生的体力劳动,加快患者的康复。目前,机器人辅助腹部微创手术的研究成果很多。本论文以实验室主从设备的
在信息化时代,如何准确的鉴别一个人的身份,并且同时保护该信息的稳定性和安全性,已经成为了越来越重要的问题。掌纹识别技术是一种新兴的生物特征识别技术。相比于其他识别方法,掌纹识别具有对环境的要求低,手掌容易采集;采集设备精度要求不苛刻,造价低的优点。然而掌纹识别是一个极其复杂的过程,非接触环境下采集到的掌纹图像容易受到手掌姿态的影响,存在尺度变化和对齐问题。局部不变性特征对旋转和仿射变化具有更强的鲁