基于双流强化学习的细粒度图像识别方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mugua604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度图像识别是计算机视觉中一个重要又具有挑战性的研究领域。相较与粗粒度地区分“鸟”和“狗”,细粒度图像识别是更加细致地区分“鹦鹉”和“喜鹊”。细粒度图像识别在工业方面和学术方面都有非常广泛的使用需求和应用场景。细粒度图像的特点是类别间差异微小,一般只有利用微小的局部区域才能区分开各自不同的类别。现有的方法很多都是尝试学习如何找到区分性的区域,然后通过裁剪和放大这些局部区域来实现识别。尽管已经实现了令人鼓舞的性能,但是此过程中还存在一些问题。首先,这些方法都是只在纹理域中定位比较合适的区域而没有在形状域中分析图像,大量有用的信息被忽视了。其次,区分性区域的个数是事先指定的,不能适应所有图像的内容就限制了模型的有效性和灵活性。这些问题会导致识别效果不好。本文提出了基于双流强化学习的细粒度图像识别技术,主要贡献如下:(1)提出了一种用于细粒度图像识别的形状和纹理双流结合的方法。该方法可以有效地结合形状和纹理两种域,做出更加合理的预测。为了训练一个学习形状信息的模型,我们使用图像转换的方式抹去原始图像的纹理信息,生成一个和原始数据集对应的包含更多形状信息的新数据集。利用两个成对的数据集让模型能够联合学习纹理和形状信息。(2)提出了一种利用强化学习寻找多个最优区域的方法。此方法非常适合对离散时间顺序决策过程进行建模。在此DRL(Deep Reinforce Learning)的学习过程中定义了合适的Action、State、Reward、Policy。使用深度强化学习的方式解决了在图像中定位区分性区域的问题。最终将以上两个方法整合到一起,此框架使用强化学习的方式在形状和纹理两个域中分别寻找最合适的区分性区域,最终结合两个域后得到预测结果。此方法在CUB-200-2011数据集的识别效果达到87.95%,比基础模型(Res Net50)高出2.33%
其他文献
2019年12月,住房和城乡建设部、国家发展改革委发布《房屋建筑和市政基础设施项目工程总承包管理办法》(建市规[2019]12号),并自2020年3月1日起施行,标志着我国工程总承包管理迈入新台阶。在此基础上加快对EPC总承包模式的研究探索,更具有积极的现实意义。本文首先通过文献研究法,较为全面的介绍了EPC总承包管理模式、特点、差异,重点是与传统房建施工的差异性、优势。随后通过理论和案例分析,从
为了给薄片再生放大提供一个优良的种子激光,获得高单脉冲能量,高平均功率的短脉冲或超短脉冲的激光输出,本文提出了种子源加光纤放大的方案,采用分布式反馈激光器(Distributed Feedback Laser,DFB laser)作为种子源,掺镱光纤作为放大器进行光放大的技术方案,即主振荡功率放大(Master Oscillator Power Amplifier,MOPA)技术,与薄片放大系统光
现代系统正在往复杂方向发展,一旦发生故障会造成巨大的损失,因此人们迫切的需要可靠的系统.“容错”原是计算机系统设计技术中的一个概念,容错是容忍故障的简称.在一个系统中,更多需要考虑的是针对执行器和传感器的容错控制.一个系统能够容错的必要条件是系统中存在着冗余,即对执行器的容错需要有执行驱动冗余、对传感器的容错则需要存在传感测量冗余.容错控制系统设计的关键是如何使用这些冗余来达到容错目的.研究容错控
复杂曲面零件广泛应用在航空航天、运输、能源等重要领域。机器人具有智能化、操作空间大、柔性好等优势,因此采用机器人实现复杂曲面零件的加工成为了目前的研究热点。然而,面向多品种、小批量、非结构化复杂曲面零件如航空发动机叶片、燃气轮机叶片等,机器人离线编程困难、配置周期长。结合虚拟夹具的机器人动觉示教可实现人手操作轨迹向机器人迁移,克服机器人离线编程效率低、示教学习精度差等不足。然而,虚拟夹具辅助机器人
本论文旨在总结分析当前持久性有机污染物在长江流域内的分布现状,探讨不同环境介质以及不同地区内持久性有机污染物的分布的差异性与规律性,并对于持久性有机污染物对城市人群的健康影响进行评估,为进一步控制污染以及维护人们健康提供参考。总结文献检索平台上相关文献,进行总结归纳,针对采样检测数据进一步进行环境与健康风险评价,提出典型持久性有机污染物的分布规律,计算相关风险值进行评估。基于知网、万方、Web O
随着毫米波辐射测量技术的不断发展成熟,被动毫米波极化测量技术作为目标信息获取的一种有效方法受到国内外学者的广泛关注。毫米波具有全天候的特性,能够穿透衣服、云雾等等,在人体安检、军事目标探测、火灾消防、地形测量等方面发挥着重要作用。目前,通过被动毫米波极化测量可以对目标进行金属与非金属材料分类,获取目标的属类信息,是除可见光、红外和雷达之外的又一重要探测手段,具有重要的科研价值和国防战略意义。本文首
攻击者很容易利用计算机网络不可或缺的网络基础设施——DNS域名系统,构建DNS隐蔽通道进行隐蔽通信。恶意利用DNS隐蔽通道的攻击行为给企业和个人造成严重的信息安全威胁。当前,DNS隐蔽通道检测工具仍停留在实验室阶段,其使用范围大多是局域网且安装部署复杂。本文旨在设计一个普通用户可以使用的DNS隐蔽通道检测系统来保障个人计算机不受DNS隐蔽通道威胁。DNS隐蔽通道检测系统基于MVC设计模式,包含四个
学位
伴随着目前信息时代的飞速扩张发展,信息资源,数据资源是一切的根本,信息检索的使用范围越来越庞大且不可或缺。检索系统可以解决传统的搜索方法中部分错查,误查,漏查,无法给用户提供针对性的检索服务等问题。为了可以针对公司内部数据和内部员工提供更加个性化的检索服务,可以缓解检索效果不佳所带给用户的不便,减少用户的检索耗时,提升用户的使用体验,设计并实现了检索系统。系统在离线段,首先从网络上爬取,收集金融、
忆阻器以其尺寸小、功耗低、易集成、非易失性等诸多优点,在非易失性存储,模拟人工神经网络,模拟电路和数字电路等领域有着广泛的应用。现有的忆阻器通常表现出阈值电压特性,即只有在忆阻器两端的电压大于阈值电压时,忆阻器的阻值才发生变化,小于阈值电压时忆阻器的阻值保持不变可作为负载电阻。高于阈值电压时,阻值可通过编程方式连续调制,实现基本电路性能的动态可调。因此,可将这一新型的基本电路元件忆阻器引入电路设计