细粒度图像分类方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:dizenxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来及计算机硬件的发展,尤其是近年来深度学习的兴起,语义级图像分类和实例级图像分类取得了长足的进展,而更具挑战性的细粒度图像分类问题,即关注同一类别内相似子类别的图像分类,如识别不同品种的鸟类,成为一个新的研究热点。本课题立足于海量数据的收集与GPU计算能力的突破,基于兴起的深度学习方法,围绕细粒度问题的本质特点,研究探索细粒度图像的分类方法。在无需物体标注框和关键区域信息的条件下,提出了一种基于图像局部区域的分类框架。基于该框架,研究了两个变型:基于自适应机制的细粒度分类方法(PFNet)和基于高斯混合模型的细粒度分类方法(GMNet)。公开数据集上的测试表明,上述方法在细粒度分类上取得了近期较好的分类精度。本课题主要工作包括以下三个方面:(1)针对细粒度图像高类内方差、低类间方差的特点,提出了一种基于图像局部区域的分类框架。并针对不同图像区域的特点,提出了基于自适应机制的细粒度分类方法(PFNet)。PFNet能够在训练中自适应地融合不同类型的局部区域,包括简单区域、困难区域和背景区域。它主要包括局部特征提取器和两级分类网络。其中,两级分类网络由局部级和整体级损失函数构成。前者通过自适应机制给不同的局部区域分配不同的权重,后者对局部特征融合形成的整体特征进行训练。(2)针对PFNet特征融合方法过于简单、无法对整体分布建模的缺点,进一步改进并提出了基于高斯混合模型的细粒度分类方法(GMNet)。GMNet通过高斯混合层对局部区域特征分布进行建模。它使用若干个高斯核对局部特征进行拟合,并融合得到整体特征。模型的训练是一个嵌套的两层循环。外循环是整体网络的优化,内循环是基于EM算法的高斯混合层训练,两者通过梯度传播进行协同优化。(3)分别对PFNet和GMNet在数据集上的分类表现、参数设置和关键模块作用进行了细致的研究,并给出了定性和可视化分析的结果。实验表明,两个模型在四个广泛使用的数据集CUB-200-2011、Stanford Cars、FGVC-Aircraft和Stanford Dogs上均取得了近期最好或不错的结果。
其他文献
关键词是文档主题信息的精炼,借助关键词可以快速地获取文本主旨,其研究成果可广泛用于文档检索、文本分类、文本主题挖掘等具体领域。传统基于图的关键词提取方法主要研究的
为了解决铁矿巷道开采过程中采用尾矿砂钢纤维喷射混凝土作为巷道衬砌的应用问题,以尾矿砂取代天然河砂作为细骨料配制钢纤维喷射混凝土,并对不同钢纤维掺量的喷射混凝土进行
磁液双悬浮轴承采用电磁悬浮与液体静压两种混合支承形式,具有承载能力强、支承刚度大、无摩擦磨损、调节响应快速、主动控制性好的优点。但由于其数学模型复杂及非线性、磁
近年来,左手材料的发展非常迅速,不同谐振频段的左手材料被广泛应用于实际需要的各个方面,所设计的微波频段左手材料可以应用于目前非常流行的微波检测领域。在实际应用中,需
严格控制钻井液的性能参数对于平衡压力钻井具有重要的意义,而气侵现象会严重改变钻井液的密度,导致其密度下降,粘度升高,对钻井安全带来危害。除气器是用于除去气侵钻井液中
近年来,随着油田开发进入中后期,早期优质储层已经开采殆尽,原本不列入油田商业开发的低渗透型油气田逐步进入人们视野。新肇油田是典型的低渗透裂缝型异常高压油气田,经过近
随着语音识别技术地快速发展,说话人识别作为语音识别的一个重要组成部分,已经被广泛地应用到商务、安防、金融、刑侦及个性化应用等诸多领域,在生物识别技术中也占据了越来
脂质是一类低溶于水而高溶于非极性溶剂的生物有机分子,具有复杂的生理活性和多样的分子结构。国际上通常将脂质分为八大类,即脂肪酰类(fatty acids))、甘油酯类(glycerolipi
镁合金由于具有密度小、比强度、比刚度高以及环境友好等诸多优点,近年来已经成为汽车、航空、航天、电子等领域应用的重要轻量化材料。但是其在高温条件下的低强度制约了镁
AGV,即“自动导引移动小车”,它是一种能够在地面上沿着期望的导引路径行驶,并且具有安全保护、能够自主避障行驶到达各个指定目标地点的无人运输小车。近年来随着计算机技术