论文部分内容阅读
视觉显著性检测就是用计算机和成像设备来模拟人类的视觉注意系统,快速地从大量景象中提取关键信息,为智能视觉系统提供高效的预处理。虽然目前显著性检测领域已经涌现了大量的算法,但是想要研发出一个快速且能处理复杂图像的显著性目标检测方法仍然存在较大的挑战。本文提出了一个新颖的、无监督的显著性检测模型,该模型是基于目标候选区域和多示例学习而建立的。目标候选区域指一系列有可能包含目标的区域,被广泛应用在各种视觉任务中。然而,目前大部分的显著性目标检测算法仅仅利用目标候选区域计算位置先验。本文巧妙地将目标候选区域作为多示例学习的示例包,将目标候选区域中包含的超像素作为包中的示例,同时考虑到了高层次的目标信息和中层次的区域信息。然后通过一个在多示例学习框架下的分类器来预测示例的显著性标签,这就将显著性检测问题转化为一个多示例学习任务。该模型是基于包层次的,在寻找决策边界时具有一定的灵活性,并且能从模棱两可的目标候选区域中检测出显著区域。为了进一步提升该算法的检测结果,本文构建了一个传播显著性标签的能量函数,将图像中的外观相似性、结构信息平滑和全局独特性三个准则融合为一个目标函数,并且求出了闭合解。此外,本文将多示例学习嵌入到一个优化机制中,从现存的显著性检测算法的结果中获取训练包,并将训练样本从容易被分辨的迭代更新为难以区分的,最终学习出一个强的显著性分类器。该优化模型能极大地提升现存的显著性目标检测算法的性能。本文在六个被广泛应用的显著性目标检测数据库上进行了大量的测试和评估。首先,为了了解算法的各个部分的性能,本文对各个子模块进行了实验分析。然后,将本文提出的算法和一些经典或最新的显著性方法进行了实验比较和分析,通过三个不同的评价标准验证了本文算法较优的性能。