基于双线性卷积神经网络的细粒度图像分类方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:greenboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度图像分类相较于粗粒度图像分类,是针对图像大类别下进行精细的子类别的划分,在识别濒危物种的类别、创建物种识别系统等领域有着较为广泛的应用,成为近年来计算机视觉领域受关注的研究课题。对于细粒度图像分类任务,图像的类间差异较大而类内的差异较小,利用传统卷积神经网络进行此种分类任务效果一般,主要是图像之间很高的外观相似度增加了分类误判率和分类的难度。双线性卷积神经网络(B-CNN)在不借助部位标注情况下,采用两路卷积神经网络,协调完成物体的局部特征提取和信息分类,从而提高细粒度图像分类准确率。基于B-CNN设计的低秩双线性卷积分类模型(LRBP)由于能够大幅降低参数的维度,成为双线性网络模型中分类效果较好的模型。但是LRBP模型没有有效解决针对细粒度图像分类任务下将具有典型分辨力的关键图像区域准确定位的问题,以及在已检测的关键图像区域中有效地提取可鉴别的特征进行分类的问题。论文基于双线性卷积神经网络LRBP模型对上述问题进行研究。论文的具体工作如下:(1)设计了一种基于LRBP结合残差与注意力机制的细粒度图像分类模型(LBCNN-RA)。LBCNN-RA模型利用深度残差网络解决了卷积神经网络层数增加时梯度消失问题,同时将深度残差网络与注意力机制结合为残差注意力模块,其中注意力机制部分由通道注意力与空间注意力双模块串联组成,以通道与空间两个维度获得图像的注意力信息,从而有效地定位出具有典型分辨率的关键图像区域,最后进行双线性低秩化聚合并使用softmax进行分类。实验结果表明,LBCNN-RA模型在CUB-200-2011数据集上相较LRBP模型分类准确率提高了2.2%,在Stanford Cars上相较LRBP模型分类准确率提高了1.3%。(2)设计了一种基于LBCNN-RA引入双尺度融合的细粒度图像分类模型(RALBCNN-DS)。RALBCNN-DS模型首先使用LBCNN-RA模型中的深度残差与注意力结合网络进行训练,然后进行双线性网络低秩化聚合,最后在网络分类时,引入中心损失的度量学习方法,将softmax和中心损失两个尺度的分类特征进行融合学习,从而从双尺度维度有效地提取出已检测的关键图像区域可鉴别的特征,达到更好的分类效果。实验结果表明,RALBCNN-DS模型与基础模型LBCNN-RA相比,在CUB-200-2011数据集上分类准确率提高了0.5%,在Stanford Cars上分类准确率提高了0.7%,最后与当前其他细粒度图像分类模型的分类效果进行对比。
其他文献
人类基因密码的破译和图谱绘制的完成,极大地鼓舞了科学家对生老病死的规律、生命起源与进化的过程、生物个体间高矮胖瘦差异性的成因等谜题的研究热情。以此为基础,为了更全
第一部分子宫内膜增生及癌变患者血清Apelin表达目的:研究脂肪细胞因子Apelin在子宫内膜增生及癌变患者和正常子宫内膜之间的血清学表达的差异,观察其与子宫内膜增生及多种临床特征的关系,进一步探讨血清Apelin水平与子宫内膜增生及癌变的关系。方法:收集2018年3月-2019年10月,在天津医科大学总医院因异常子宫出血或超声影像学异常就诊,行宫腔镜检查及诊刮术的、病理结果判定为子宫内膜增生或子
随着海洋强国战略的实施,海洋及港口建筑物和构筑物将成为新的建设热点,采用传统的钢筋混凝土结构应用于海洋工程,不仅增加建设工期与成本,而且还会加剧天然砂石资源与淡水资源的消耗。采用玄武岩纤维增强复合材料(Basalt fiber reinforced polymer bar,BFRP)筋增强海水海砂混凝土建设海洋工程结构,既能从根本上避免钢筋的锈蚀问题,又解决了淡水与河沙资源匮乏问题。但在强碱环境下
单胺氧化酶(monoamine oxidase,MAO)作为一种含黄素蛋白酶,结合在线粒体外膜上,通过氧化脱氨来调节体内的单胺水平,单胺类物质是人体内最重要和最普遍的一种神经递质。体内MA
分数阶微分方程在科学计算领域有广泛的应用,如分数阶微分方程可以描述物理中的许多现象,特别的,分数阶扩散波方程可以准确地描述反常扩散现象.基于有限差分的微分方程的QTT
住房保障制度的建立是解决中低收入家庭住房困难的有效措施,能促进社会和谐稳定发展。特别是在现阶段房价不断上涨的情形下,住房保障显的尤为重要。然而,在保障房的运行管理
随着社会经济的快速发展,环境污染、资源约束趋紧等问题愈发严重,生态环境对经济社会发展的抑制作用日益凸显,推进生态文明建设开始受到高度重视。县域经济作为国民经济的重
本文利用2014年7、8月中国气象局台站观测资料、JRA-55逐日再分析资料、GPCP全球降水逐日观测资料、“第三次青藏高原大气科学考察试验”3m涡动相关系统原始数据和10Hz湍流资
在本文中,首先我们将用延拓的方法重新给出分数阶Laplace算子的定义,接下来会叙述并给出分数阶方程上下解方法的证明,最后将讨论带有边缘场的分数阶MEMS方程解的存在性.在第
能源问题是人类文明进一步发展需要解决的首要问题,提高能源利用率、传热效率的方法和技术的突破显得尤为重要。核态沸腾作为一种高效换热方法,广泛应用于各种存在高热流密度的工业领域,同时各种强化核态沸腾的手段和方法得到了大量地研究。实验研究已经表明微柱结构表面能够有效强化沸腾换热系数并提高临界热流密度。但是核态沸腾作为一个涉及气、液、固三相且存在一定随机性的问题,实验手段在测量各种物理量的细节上存在限制,