【摘 要】
:
随着人工智能技术的不断发展,显著性目标检测在计算机视觉领域的应用变得越来越广泛,逐渐成为了一项很有挑战性的任务。根据任务要求,算法需要检测出图像中最显著的一个物体或者一部分区域,对图像的可解释性工作帮助很大。因此可以应用在很多图像处理任务中。显著性目标检测现阶段主要分为基于传统数学模型的显著性检测方法和基于深度学习的显著性检测方法。传统算法一般较难提取到图像的深层语义特征,在复杂图像中的检测效果较
论文部分内容阅读
随着人工智能技术的不断发展,显著性目标检测在计算机视觉领域的应用变得越来越广泛,逐渐成为了一项很有挑战性的任务。根据任务要求,算法需要检测出图像中最显著的一个物体或者一部分区域,对图像的可解释性工作帮助很大。因此可以应用在很多图像处理任务中。显著性目标检测现阶段主要分为基于传统数学模型的显著性检测方法和基于深度学习的显著性检测方法。传统算法一般较难提取到图像的深层语义特征,在复杂图像中的检测效果较差;基于深度学习的方法使用神经网络,网络的训练过程由数据驱动,缺少相应的先验信息,会产生一定训练误差,影响算法的显著性检测效果。针对这些问题,本文基于人类视觉感知逻辑,设计了一个基于特征比对模块的多阶段显著性检测网络,并在多个数据集上证明了算法的有效性和实用性。本文主要创新点如下:(1)提出了一个基于特征比对的显著性特征提取模块。先提取图像中每个区域周围的环境信息,再通过特征比对的方法对该区域的特征信息与环境信息进行交互计算,得到与原特征图尺寸相同的掩膜,最后将掩膜与原特征图融合,增强显著性区域并抑制非显著区域从而获得显著性特征。同时将本文的模块与R3Net结合,在显著性数据集上验证了本文模块可以提高网络backbone阶段的显著性特征提取能力,促使网络更准确地检测显著性目标,并通过对比实验证明了本文模块的通用性和优越性。(2)提出了一个基于感知逻辑和特征比对的显著性检测网络。人类视觉感知逻辑是先进行简单的预注意过程获得候选特征,再通过注意力集中过程得到我们需要的特征。通过分析视觉感知逻辑的特点,我们设计了一个多阶段显著性网络。网络先通过通用特征提取模块提取图像的通用视觉特征,之后通过特征预处理模块修正特征,再通过专用特征提取模块提取符合显著性任务要求的特征信息,最后基于得到的专用任务特征进行显著性预测。本文以现有已公开的5个显著性自然数据集为例,对本文的网络进行了指标和效果测试,并与当前的SOTA网络进行了对比,结果证明了本文网络在指标和检测效果方面均优于现有网络。(3)提出了一种基于视觉感知机制的显著性网络训练方法。为了充分提高网络的性能,我们通过分析人类视觉感知机制提出了一种特殊的网络训练方法,在网络的训练阶段,网络的backbone使用迁移模型并且不更新参数。先提取通用视觉特征再进行特征预处理来使网络适应当前数据集,此方法可以防止backbone经过微调后性能下降。通过对比实验证明,该方法能够提高网络训练的速度和网络检测的准确率。
其他文献
地图构建是移动机器人领域的重点研究方向,是移动机器人实现自主导航的前提。地图构建的核心技术是同时定位与建图(Simultaneous Localization and Mapping,SLAM)。SLAM是指机器人本体在未知环境中运动时,估计自身运动,同时构建环境的地图。移动机器人在室外的地图构建方法选择和应用是其设计的难点之一。SLAM按其传感器类型可以分为基于激光雷达的SLAM方法和基于相机的
随着互联网的飞速发展,网络社区用户对数据交换的需求急剧增长,网络数据共享的方式也逐渐多样化。基于FTP和HTTP协议的中心化文件下载服务器为社区用户提供了高密度的信息,但是独立服务器的运营成本高,且社区运营者的个人决策行为会给社区共享网络带来不确定的风险。商业网盘凭借其跨平台、高质量的文件管理方式,为数据共享提供了额外的可选项,但是通过网盘共享的资源较为分散,导致信息密度低,增加了用户的筛选成本。
近些年来,无线通信技术成为人们生活中不可或缺的一部分。随着无线通信技术的发展,通信业务方面的需求也在提高,带宽宽、结构简单、功耗低以及通用化是射频前端技术发展的必然趋势。为满足通信业务的相关需求,选择合适的变频结构也是至关重要的。频谱搬移是无线通信技术的核心之一,对传统的超外差变频结构而言,其需多次的频谱搬移才能满足需求,势必导致成本、空间以及功耗的增加。在零中频变频结构中只需一次频谱搬移就可以实
时变问题在科学与工程领域受到广泛关注,如信号处理、机器人控制、人脸识别、在线计算等.本文主要探讨求解时变非线性方程组的两层迭代法,具体工作如下.首先关注时变非线性方程组的求解精度问题,借助经典Newton法的思想推导出一个适用于时变非线性方程组的时变Newton法,并通过引入两层迭代思想,将经典的Newton法作为内迭代控制时变非线性方程组的求解精度,构造出两层Newton迭代算法.理论分析表明该
一般三次覆盖的分歧曲线次数为偶数且仅以尖点作为奇异点.用3可除集的概念可以对曲线与曲面的尖点进行研究,利用3可除集的概念也可以对某类一般三次覆盖进行分类.本文介绍了 3可除集的定义与有关性质,说明了 3可除集与三次循环覆盖之间的关系.推广了3可除集,提出并定义了5可除集的概念来研究曲面上A4型奇点.通过推广3-挠群与F3上的三元编码等概念,得到了 5-挠群与F5上的三元编码.构造了一个与5可除集对
本文研究了R2中有界正则区域Ω上的Emden-Fowler型方程(?)其中λ>0,A(x)=(aij(x))是一个二阶正定对称矩阵.aij(x)(i,j=1,2),b(x)是Ω上的光滑函数,并且满足条件(H):0<α≤aij(x),b(x)≤β<∞,i,j=1,2.我们考虑该方程的解的渐近行为,并且证明了方程的非极小解uλ在a(x)=(?)的临界点处爆破,同时我们还证明了,?p ∈(1,2),在W
截至2019年,我国常住人口城镇化率已经突破了60%,这一数字是全社会方方面面长足进步的一个缩影。然而这一过程中也产生了很多矛盾:如资源消耗和产出的不匹配、人口和土地城镇化的不协调、区域间信息的不对称等。因此,在研究城镇化问题时,除了关注城镇化率的增长外,还应重视效率问题以及效率的影响因素。随着区域间联系的日益紧密,为城镇化问题的研究带来了新的视角;空间分析工具的不断发展,为各区域间的异质性问题带
人工智能已经越发地贴近人们的日常生活之中,自动识别车牌,通过面部识别来进行支付操作,都已经融入到了社会的各行各业之中。而这些识别系统的核心算法大部分都是来自于卷积神经网络(CNN)。虽然卷积神经网络在图像识别领域已经是非常成熟且应用良好的一个算法,但卷积神经网络依旧存在着一些问题,诸如卷积神经网络的不可解释性,在学习过程过分强调不变性特征的学习,都是卷积神经网络无法规避的问题。胶囊网络在网络结构上
实验实现玻色-爱因斯坦凝聚开启了在超冷原子气体中对宏观量子效应的探索。在凝聚态物理中,由于体系中存在着多种相互作用,所以准确研究粒子的动力学以及每一种相互作用的效果是很困难的。当超冷原子被装载入光晶格中时,高度的纯净性和可控性使得该体系能成为一个理想平台来进行量子模拟,包括研究晶格势中粒子的动力学和新奇的量子效应。在此基础上,通过施加自旋-轨道耦合效应,电中性的超冷原子还可以被用来模拟电磁场中带电
设图G是连通图,若删去G的至少k个顶点才使G不连通,则称图G的连通度为k.设图G是k-连通图,若删去G的任意一条边都会减小G的连通度,则称图G是极小k-连通的.极小1-连通图就是树,所以本文只研究连通度至少为2的图.我们把彼此同构的图看作是同一个图,因此本文研究的某一类图的个数指的是两两不同构的图的个数.本文确定了所有阶数不超过8的极小2-连通图、极小3-连通图、极小4-连通图,得到了相应极小2-