论文部分内容阅读
图像显著性检测是计算机视觉领域中的关键技术之一,在实际的计算机视觉任务中也起着重要作用,其主要目标是模拟人类视觉注意系统来寻找到人们所感兴趣的区域。因此显著性检测研究所面临的核心问题首先是如何获得与人们主观意志一致的检测结果,其次是当在复杂语义场景下,被关注的目标不规则且具有二义性时,如何来确定背景区域与前景对象二者之间的差异。近年来,虽然深度学习在计算机视觉方面取得了一定的发展与成就,但特征信息在自上而下传递过程中仍存在细节特征被稀释的问题,局部特征保持方面还存在很多不足。因此,本文将从有效关注局部细节方面的信息出发,对显著性检测中的关键问题进行深入研究,主要研究工作与贡献如下:(1)提出了一种多尺度反卷积的深度学习网络模型。在多尺度下对各层特征及各层对比特征进行反卷积,充分利用反卷积层中的卷积核对输入物体的形状重建的作用,在多种分辨率特征图上利用反卷积网络来学习细节特征,减少信息的丢失,以此来保持不同尺度特征图的细节信息;然后,将各尺度下的反卷积特征进行融合形成多层次局部信息;最后与VGG16网络提取的全局信息融合后计算各个像素的显著值获得最终显著性检测结果。实验结果表明,多尺度反卷积结构表现出较优的性能:与传统方法相比,可以相对增强突出物体与背景之间的对比,保持细节方面的特征,与最新的深度学习方法相比可以有相对清晰准确的区域,在一定程度上减少了信息的损失,还原出更多的细节,能够有效地获取各种分辨率下的显著性目标,而且各反卷积层的独立性也显著提高了检测算法的运算速度。(2)提出了一种多分组膨胀卷积网络的显著性检测算法。为了有效扩大感受野来获取丰富有效的上下文场景语义信息,采用包含多个不同扩张率的分组膨胀卷积层来构成多尺度上下文感知特征提取模块,用于扩大感受野来学习目标区域信息和图像上下文的语义信息,以便重点研究有效的高层上下文特征和低层空间结构特征;然后利用对比度特征捕获每个特征相对于其周围亮或暗区域的差异,利用卷积组合反卷积模型来得到多层局部细节信息,最后将预测结果有效地结合起来得到最终的显著性图。在五个基准数据集上的定量和定性实验表明,本文的方法在获得显著性提升的同时,比许多其他的显著性检测方法,在有诸多不确定性因素的复杂场景下,例如目标不规则、具有二义性时仍具有较好的自适应性,能应用于多种场景变化。综上所述,本文将多尺度反卷积网络模型和多分组膨胀卷积网络模型结合并运用到图像显著性检测任务中,所提出的方法在显著性检测效果方面有了一定的提高,大量的实验结果也证明了模型的有效性,同时也为图像显著性检测算法的研究提供了一些新的思路。