【摘 要】
:
近年来,由于深度学习在图像,语音以及自然语言处理等领域表现出的优异性能,被大量应用于解决实际问题。细粒度图像识别是图像识别中的一个细分领域,主要指对属于同一个基本类
论文部分内容阅读
近年来,由于深度学习在图像,语音以及自然语言处理等领域表现出的优异性能,被大量应用于解决实际问题。细粒度图像识别是图像识别中的一个细分领域,主要指对属于同一个基本类别下的不同子类别进行图像分类这一任务。由于细粒度类别中类间差异较为细微,与一般的图像识别任务相比,更具挑战性。本文主要研究细粒度图像识别相关算法,以及这些算法在昆虫形态分类上的应用。针对细粒度图像识别问题,本文首先分析了这一任务中的关键问题,然后提出了利用卷积网络的注意机制进行细粒度图像识别的模型,模型中包含几个部分:1.利用深度卷积网络中卷积特征在空间维度的注意机制,构建的基于目标级别和部件级别注意的深度卷积网络,通过逐层放大有辨识性区域的方式,让模型学习更加细粒度的特征;2.基于卷积特征在通道维度的注意机制,和通过目标和部件的空间几何关系构造的空间约束损失函数,共同让模型关注的有辨识性的部件区域具有多样性。在CUB200-2011,Stanford Dogs和Stanford Cars等细粒度图像分类公共数据集上的实验结果,证明了上述模型的有效性。此外,针对生物图像细粒度分类的特点,本文提出了层次分类网络,能够在对生物图像进行细粒度识别的过程中使用不同类别间的结构信息,在一定程度上提高分类准率。最后,对于复杂背景中的细粒度图像的检测问题,本文提出了先用检测网络区分前景和背景,再用专门的细粒度识别网络对检测框中的物体进行识别的两阶段方案,实验结果证明了这一方案的科学性。最后,本文将上述方法分别应用于对有害昆虫和野外拍摄的蝴蝶图像的细粒度识别之中。实验结果表明,上述方法对于基于图像的昆虫形态分类有较高的精度,证明了本文的方法用于处理实际问题的可行性和有效性。
其他文献
无水化合物对于提高锂离子/钠离子电池的性能具有至关重要的作用,但是如何在温和的水热/溶剂热合成方法中制备获得无水化合物对于科学家而言一直是一项极具挑战性的工作。近
超材料(Metamaterials)作为一种人工复合结构或复合材料,具有天然材料所不具备的超常物理性质,近年来在获得了广泛关注。超表面(Metasurface,MS)作为超材料的二维表现形式,不
TiB2和TiC陶瓷因具有高强度、高熔点、高导电率和低密度等优异的性能而成为能在高温、反应气氛、机械热载荷和磨损等组成的极端环境中使用的理想材料。在飞机推进系统、航天
利率变动会导致物价水平发生怎么样变化?这是一个很有意义又存在争议的问题。为了厘清利率对物价水平的影响机制,为央行制定货币政策调控宏观经济提供理论依据和实证经验,本
作为一类重要的混杂系统,切换系统由一族子系统和一个描述子系统如何切换的切换信号组成。切换系统独有的特性使得它在工程实践领域的应用越来越广泛,尤其在解决复杂系统问题
传统的检测方法一般都基于光学、电磁学或电化学相关理论与特定的分析化学原理结合以达到对目标样品的检测要求。这些方法固然有检测精准、通用性好的强大优势,但传统的精密
碳纳米管(Carbon nanotubes,CNTs)是最有前景的场发射阴极材料之一。但CNTs薄膜阴极在劣真空、高电场等恶劣工况下,CNTs薄膜的抗损伤能力、可重复性及稳定性受到负面影响;以及薄膜在与器件的组装过程中易受到人为损伤,这都限制了碳纳米管阴极的实际应用。为此,本论文提出碳纳米管块体阴极的方案来解决这些问题,从碳纳米管块体阴极的制备与优化、阴极表面处理等方面开展了一系列工作,得出了一些
多波长掺铒光纤激光器(Multiwavelength Erbium-Doped Fiber laser,MWEDFL)作为光通信领域中最有发展前途的光源之一,摒弃了传统半导体激光阵列操作复杂、结构庞大和成本高昂等缺点,具有高增益、宽带宽、插入损耗低、结构简单等优点,其增益曲线几乎覆盖了波分复用(WDM)系统1550 nm的工作波长范围,在密集波分复用、光纤传感、光学测量等领域有广阔应用前景。然而,
图像序列的光流估计理论在机器视觉领域已被提出多年,但算法的高计算复杂度限制了其在工业领域的应用。为了满足应用的实时性要求,基于FPGA的Lucas和Kanade光流计算方法已经
随着物联网行业的蓬勃兴起,方向追踪在工程、建筑、交通等领域得到了广泛的应用。RFID技术以其无源性、安全性、便捷性等优势克服了传统技术的保密性差、代价昂贵、环境依赖性强等方面的不足成为了物联网时代的热门技术,同时HMM作为一种数学统计模型具有较强的时间序列建模能力。因此,为了满足物联网用户的现实需求,本文针对RFID技术与HMM相结合以实现方向追踪进行了深入研究。主要研究内容如下。首先,分析了相位