【摘 要】
:
得益于人工智能理论的进步和计算机硬件水平的提升,计算机视觉技术在近年来得到了快速的发展,与计算机视觉技术相关联的实际产品也逐渐走入了我们的生活。图像识别技术是计算机视觉技术的一个重要的研究领域,其根据识别场景又可分为粗粒度图像识别技术和细粒度图像识别技术。过去几年中,大部分的研究集中在粗粒度图像识别技术中,但受到实际应用场景的驱动,对细粒度图像识别技术的研究得到了越来越多的关注。相比于粗粒度图像识
论文部分内容阅读
得益于人工智能理论的进步和计算机硬件水平的提升,计算机视觉技术在近年来得到了快速的发展,与计算机视觉技术相关联的实际产品也逐渐走入了我们的生活。图像识别技术是计算机视觉技术的一个重要的研究领域,其根据识别场景又可分为粗粒度图像识别技术和细粒度图像识别技术。过去几年中,大部分的研究集中在粗粒度图像识别技术中,但受到实际应用场景的驱动,对细粒度图像识别技术的研究得到了越来越多的关注。相比于粗粒度图像识别技术,细粒度图像识别技术是对同一大类下的细分子类目标进行识别分类,因此该技术对应的任务场景的难度更高。本文基于深度学习方法,对使用弱监督信息完成监督学习的细粒度图像识别算法模型进行了研究,并使用相关数据集对所研究方法的识别效果进行了实验验证。本文的主要工作可分为以下三个部分:(1)针对细粒度图像的特点,本文以提高算法模型对不同级别特征的提取能力和减小图像风格对模型带来的干扰为切入点设计了IBN-LANet。该网络使用了深度层次聚合网络为架构,在网络归一化层中引入了实例-批归一化方法。通过这种设计,网络提升了对细节特征的提取能力,同时对输入图像数据中不同的图像风格有了更好的鲁棒性,从而提升了其对细粒度图像的识别能力。在相关细粒度图像数据集上的实验结果表明,该网络模型达到了优秀的细粒度图像识别正确率。(2)基于提升网络的特征表达能力,保留更多网络在卷积层中提取到的细节特征信息的目的,本文在第一部分的工作内容的基础上进行了进一步探究。针对细粒度图像识别任务的要求,本文分析了在卷积神经网络中数据由特征图过渡到特征向量时丢失过多细节特征的缺点,之后在第一部分工作的基础上对网络的全局池化层进行了改造,设计了FG-Net和FG-LANet。这两种网络的特点是添加了全局协方差池化层的设计,通过使用二阶统计量协方差替代一阶统计量均值作为池化输出,极大地丰富了在池化后的特征向量中包含的特征信息,提高了网络对细节特征的表达能力。本文在相关细粒度图像数据集上对这两种网络进行了实验,结果表明FG-Net和FG-LANet在细粒度图像识别任务中有着优异的识别效果。(3)为了对本文所设计的算法模型进行更多探究,除了细粒度图像数据集外,本文还使用了大型图像数据集ImageNet 2012对所设计的三种网络进行了实验。结果显示本文所提出的模型结构设计在1000个分类数量的图像识别任务中同样取得了优异的识别效果。这表明了本文所设计的网络结构具有很好的泛化性能,可以在更多图像识别任务中进行进一步探究。
其他文献
恶劣海况下无人船的对准技术,作为无人船系统导航与制导技术的重要前提,是保证无人船在恶劣海况下自主航行以及正常工作的关键。为解决自主和智能化的无人船系统在对准中面对不确定干扰时,要求具有强健自适应调节能力的问题,本文结合无人船在恶劣海况下的运动学特性,基于大失准角的运动背景,对恶劣海况下无人船对准技术进行研究,确定不同海况等级以及海浪复杂干扰下的初始对准技术方案,保证恶劣海况下无人船的对准性能。本文
随着机器人领域的不断发展,机器人的导航定位问题成为了当下的研究热点。本文针对室内场景下的移动机器人平台,设计实现了基于单目相机的视觉里程计算法,并进行了实验系统的搭建。主要研究内容如下:(1)研究了针孔相机模型与相机畸变模型,并推导了相关的模型参数。针对传统相机标定方法精度不高的问题,在张氏标定法的基础上,研究了一种基于改进Harris角点检测算法的相机标定方法,进一步提高提取的角点坐标精度,为后
碳纤维复合芯导线是一种应用广泛的新型导线,具有较好的抗拉强度与较差的抗剪强度,易在非规范施工过程中被卡线器等牵引装备损伤,形成用电安全隐患。近年来,因内部芯棒受损导致的断线事故时有发生,严重威胁电网运行安全。现有的巡检探伤技术受限于无损探伤设备的重量体积、对碳纤维导线适用性等因素,均无法对已在网运行的碳纤维导线内部碳纤维芯的损伤进行有效检测。因此,设计一种新型碳纤维导线探伤巡检机器人具有重大和迫切
工业机器人作为智能制造装备的代表,高端制造业发展的焦点,其研发、制造与应用是衡量一个国家科技创新水平的重要标志。目前工业机器人重复定位精度虽能达到0.01mm~0.1mm,但其绝对定位精度仅为毫米级。并且研究表明工业机器人末端刚度仅为数控机床的1/50,其绝对定位精度受负载的影响较大,无法满足高端制造领域的任务需求。因此,本文以Staubli TX60型六轴工业机器人为研究对象,着重开展面向高端制
随着视频传输技术的深入发展,基于无线视频监控的无人值守油田工作方式已经成为现代化油田生产管理的主流趋势。ZigBee技术作为一种无线通信技术,已广泛应用于各个领域,将ZigBee技术应用到采油机监控视频领域,发挥其低成本和低功耗的优势,具有良好的应用前景。本文首先分析ZigBee网络技术,针对视频传输的数据量大和ZigBee传输的低带宽之间的矛盾,提出以设计多射频多信道网络为核心,结合H.264视
随着中国制造2025战略的提出,中国正处于从大国到工业强国的重要转型时期,伴随着互联网时代浪潮,制造业对于生产设备的自动化、智能化要求越来越高。随着传感器技术、人工智能、运动控制算法等先进技术的快速发展,机器人作为代替人工作业的重要智能设备,越来越多的应用于先进制造业中,极大的提高了工业生产效率和品质。打磨作业是工业生产中必不可少的一环,本文基于我国打磨行业现状,从实际应用的角度,针对小型工件的打
近年来,虚拟现实技术的日益成熟和计算机运算性能的稳健提升,为虚拟人群仿真技术的研究与应用奠定了坚实的基础。虚拟人群仿真技术主要包括实时绘制技术、运动控制技术和行为控制技术,其中,路径规划技术为运动控制中的关键技术之一,且体现了人类的基础行为能力,路径规划技术便成为了人群仿真中的研究热点之一。然而,已有的虚拟人群路径规划方法大多以环境已知为前提条件,无法满足虚拟人群自主学习和适应不确定性环境的要求,
目前VR虚拟现实技术在室内设计领域获得广泛的应用。设计师通过VR全景漫游的方式向用户展示精心创作的室内设计方案。各大网站上都涌现了大量的VR全景方案以供用户选择。以传统的基于文本的检索方式难以在海量的方案中精确地找到业主需要的全景方案。本文将研究一种基于图像智能检索的VR全景方案匹配方法。使用深度学习技术,通过一张室内效果图,在海量的VR全景方案库中快速准确地匹配出相似的方案。论文的主要内容如下:
同时定位与制图(Simultaneous Localization and Mapping,SLAM)是移动机器人在未知环境下进行自主导航的关键技术,目前已成为国内外学者研究的热点。而回环检测作为SLAM系统的重要组成部分,可以消除移动机器人在长时间运动后位姿估计的累积误差,保证构建出的地图具有全局一致性。本文对回环检测技术中的特征提取算法和相似性度量算法进行研究。论文的主要内容如下:(1)研究了
近年来,随着自动控制技术、通讯技术和机器人技术的不断发展,机器人在人类生活中的应用越来越广泛。单个机器人在某些应用背景下,在感知范围、计算能力、抗干扰能力等方面都有着很大的缺陷。而多个机器人协同合作可以获得更大的感知范围、更高的计算能力和更好的抗干扰能力。因此,多机器人协同合作已成为机器人学发展的新方向。在多机器人协同合作问题中,多机器人编队问题是研究多机器人协同合作的基础问题,多机器人协同对抗则