基于显著性区域特征融合的细粒度图像分类方法

来源 :天津财经大学 | 被引量 : 0次 | 上传用户:li5301251975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机硬件水平的日益提高和深度网络的不断发展,通用的图像分类技术已经趋近成熟,但在很多实际的应用场景中,人们需要对事物进行更为精细的划分,如濒危物种保护、商品自动识别等,由此产生了细粒度图像分类研究。细粒度图像分类主要是针对特定类别事物的子类别进行划分,细粒度图像通常具有类间差异小、类内差异大的特点,用以辨别不同子类的特征往往隐藏在局部区域中且十分细微。因此,如何全面准确地学习到这些显著性区域的判别性特征是解决细粒度图像分类问题的关键。本文以ResNet50为基础网络,采用NTS-Net的显著性区域定位方法,围绕如何提取和融合细粒度图像显著性区域的信息展开相关研究工作。本文的主要工作如下:1.构建了一种基于显著性区域多注意力特征融合的细粒度图像分类模型。NTS-Net已经被证明能够有效解决细粒度图像分类中显著性区域的定位问题,但该方法使用深度网络作为特征提取器来获取显著性区域的信息,没有考虑到不同卷积层和不同维度的特征对于细粒度图像分类模型性能的影响。因此,本文设计了一种基于显著性区域多注意力特征融合的细粒度图像分类模型,该模型通过联合基于低级语义特征的空间注意力模块和基于高级语义特征的通道注意力模块,能够更好地学习到显著性区域的关键信息。2.提出了一种基于显著性区域多尺度特征融合的细粒度图像分类方法。由于不同显著性区域的特征对最后输出的贡献是不一样的,突出贡献大的特征能提升分类模型的性能。同时,不同尺度的显著性区域特征能提供该局部不同层次的信息,从而为最终的细粒度图像分类任务提供更为丰富的特征信息。因此,本文在前期工作的基础上提出了一种多尺度特征融合的细粒度图像分类方法。该方法在几乎不引入任何新的参数的前提下,以较小的计算开销自适应地为每个显著性区域分配不同的权值,以突出更有判别性的显著性区域的特征,然后用多尺度的方式提取显著性区域的特征,进一步提升了分类模型的性能。
其他文献
<正> 周末,到市中心一大商场去兑现一个诺言:陪女儿吃肯德基。我们俩是下午一点多出门的,女儿吃完肯德基,才三点来钟,硬要我陪她去新华书店买书。我家的电脑已经买了六七年,近年又把拨号上网改为宽带网,网上要什么有什么,我的读书生活基本上是看显示器。昔日经常光顾的书店,是已把它凉到一边了,一年到头,光顾不了几次。"这年头,要看书,到网上一点就是,简单得很,还有谁去关照书店呢?"只是,如今是长辈得听晚辈,
期刊
期刊
随着互联网技术的发展,网络文化产业方兴未艾,引发了诸多乱象。这些乱象的背后,隐藏着大众价值观偏离主流轨道的严重问题,应该引起足够的重视。如今,作为网络文化产业的代表,网络游戏已经成为了人们生活中一种常态化的休闲方式,它引发的乱象又是格外突出。值得关注的是,网络文化的拥趸主要集中在青少年,他们价值观定型尚不成熟,容易受到网络亚文化的诱导。因此应该将网络文化中的价值观问题从文化现象中抽离出来,警惕不健
学位
当今人口老龄化的问题已经对社会安全系统的稳定性产生了影响,并让我们再一次认识到了养老金管理的重要性。作为养老金类型中重要的一种,养老金固定缴款计划(DC)相比于养老金固定收益计划(DB)在缓解金融资产的转移压力以及在降低退休后的参保人员自身长寿风险的背景下都显示出一定的优势。本文中,我们研究了带有返还保险条款的养老金固定缴款计划(DC)的稳健最优化策略,并考虑了养老金参保人员工资的不确定风险以及通
学位
随着我国经济实力的增强以及人民收入水平的提升,民众对于投资理财的关注也在不断增加。金融市场中投资产品众多,其中股票因为投资灵活、回报更高,所以大众的参与度也更高。对股票价格走势进行有效预测,帮助广大投资者规避风险,获取高额的回报,一直是国内外研究者关注的研究热点。针对股票价格预测问题,本文以神经网络为基础,结合深度学习理论,构建股票价格预测模型,主要研究工作和成果包括以下几个方面。(1)构建结合注
学位
<正>“书籍是人类进步的阶梯。”没错,读书能使人进步,经典的文学作品经过了时间的考验,凝聚了人类的智慧,《水浒传》就是其中的代表作。《水浒传》描写了北宋末年,宋徽宗昏庸无能,奸臣当道,民不聊生。山东郓城以宋江为首的众人掀起风起云涌的农民起义,让朝廷闻风丧胆,百姓拍手称快。
期刊
<正> 现在的读书人,包括我们的教师们,都不大注意一个“抄”书。其实,抄书是我国的传统学习方法中的好东西,只要“抄”之得法,“抄”之得体,“抄”又何妨呢? 这里有一则古人的故事。张溥,是明清之际的一代名家。可有人问他那么多学问哪里来时,他直言不讳:抄来的。他读书的一大特点就是“抄”,他的书房名称也很别致,叫“七录斋”,
期刊
在现实分类场景中,人们经常需要面对较少的已标记数据以及大量无标记数据。因此,半监督学习成为了新的研究热点。其中基于图的方法在分类正确率上具有明显优势,但随着现实生活中数据量的日益膨胀,半监督图方法因为较高的时间复杂度难以处理数据集规模较大的分类场景。因此,如果能在保持半监督图方法分类正确率的同时,有效降低图方法的时间复杂度,可以使其拥有更加广泛的应用空间。为此,本文以经典半监督图方法LGC为基础,
学位
电子政务项目是政府提供信息化服务的重要方式,其数量和复杂度都在持续增加。前置评审作为政府把控项目质量的第一道关卡,评审专家的知识水平决定了其结果的有效性。但是,当前的电子政务评审流程大多忽视了对评审专家的管理,缺乏标准化的专家评估机制,已有评价方法停留在浅层信息分析中,专家抽取存在知识水平配置的不均衡。所以,如何刻画专家特征、充分挖掘深层信息成为辅助专家评价的重要基础。依据知识单元理论和元评价方法
学位
目的 探讨中晚期结直肠癌患者生命质量现状及相关的影响因素,为进一步提高患者的生命质量提供科学依据。方法 选取2019年9月-2021年12月山东省青岛、济南、济宁、聊城和枣庄市11所三级综合医院收治的889例中晚期结直肠癌患者开展问卷调查,回收有效问卷881份,有效问卷回收率99.10%;其中结肠癌383例,直肠癌498例。采用本土化的结直肠癌患者生命质量测定量表(FACT-C量表;第四版)评估患
期刊