论文部分内容阅读
人类视觉系统可以从现实场景中迅速筛选出最具价值的视觉信息,进而将注意力集中于感兴趣的区域。图像的显著性检测就是通过计算机模拟人类视觉系统提取图像中比较重要的区域,从而简化后续利用的复杂度。根据现有的研究,显著性检测方法可以是基于视觉机制的启发式显著性检测,也可以是任务驱动的基于学习的显著性检测。本文主要针对基于学习的显著性检测算法进行研究,提出不同的全卷积神经网络架构,实现更加鲁棒的显著性检测模型以适应复杂的背景环境。本文主要研究为以下三方面:(1)针对当前基于卷积神经网络的显著性检测算法难以有效融合卷积特征的问题,提出了一种融合全部卷积特征的显著性检测方法。首先,将全部卷积特征映射到内部多个尺度中;然后自适应地结合各尺度特征预测出各尺度显著图,同时将各尺度显著图融合得到融合显著图,充分利用了各尺度特征使显著区域更加突出。最后使用全连接条件随机场处理网络得到显著图,能够平滑显著图区域和优化显著边界。在公开数据测数据集验证本章算法,结果表明该算法有效地融合各级特征,显著区域更加高亮,显著边界更加精确。(2)针对当前基于深度学习的显著性检测算法得到的显著区域存在背景噪声和边缘区域模糊的问题,提出了一种级联全卷积神经网络的显著性检测方法。该网络由两个级联的全卷积神经网络组成,第一阶段构建了一个基于编码-解码架构的全卷积神经网络,在编码网络中引入一个金字塔池化模块获取不同区域的全局信息,可以抑制背景噪声的干扰。第二阶段设计了边缘检测网络,通过提取网络的局部语义信息,学习显著区域的边缘,可以明确显著区域边缘。最后,通过融合两个阶段的显著图得到边界精确的显著图。在两个公开数据数据集上验证本章算法,结果表明该算法有效抑制了背景噪声的干扰,显著区域边缘明确,在各项评价指标上均表现优异。(3)针对当前基于深度学习的显著性检测算法在复杂场景中难以检测出鲁棒性强的显著性区域,提出了一种先验特征引导的显著性检测方法。首先,通过先验知识计算出先验显著图。然后由两个卷积神经网络分别学习先验图特征和原图深度特征,将先验特征通过注意力通道引导深度特征生成显著图,使网络生成更鲁棒的显著区域。最终通过循环解码网络迭代地纠正其先前错误,自动地学习改进显著性区域,从而产生更精确的显著图。在两个公开数据测试集上与现有主流算法进行对比实验,结果表明该方法在复杂场景中具有良好的鲁棒性。