论文部分内容阅读
科技进步产生了海量的数据,丰富了人们的日常生活,也给计算机视觉处理技术带来了巨大的挑战。人类视觉系统善于从海量数据中快速捕获令人感兴趣的区域,如何利用这种视觉注意机制,准确高效地提取出重要信息,滤除过多冗余数据,已成为一个炙手可热的研究课题。视觉显著性检测是计算机视觉中活跃领域之一,能够辅助并改善一系列的视觉处理任务,近年来,受到越来越多研究学者的关注。虽然目前这方面的研究取得了一定进展,但是对于可见光下的嘈杂背景、恶劣气候等因素,视觉显著性检测仍然是一个非常具有挑战性的难题。围绕上述挑战,集成多个不同但是互补的模态信息,像可见光和热红外光谱信息(RGB-T),可能会是一种提高显著性检测结果的有效方式。本文结合流形排序模型并融合多模态光谱信息,提出一种基于图的多任务流形排序模型的图像显著性检测算法以及满足时空一致性的视频显著性检测算法。针对传统可见光图像显著性检测算法中存在的问题,本文利用多模态信息的互补性,提出一种新颖的协同多模态信息的多任务流形排序模型,实现鲁棒的多模态图像显著性检测。首先,通过分割算法得到原图的超像素图,利用超像素结点之间的空间连续性以及外观一致性,构造合适的图模型。其次,通过引入模态可靠性权重并进行正则化约束以避免平凡解,构建协同流形排序模型,实现自适应的信息融合。然后,引入跨模态一致性约束和边界先验知识,并利用快速优化算法,计算出所有超像素结点的显著排序值,实现多模态图像的显著性检测。最后,为促进显著性检测算法的评估,本文创建了一个基于可见光-热红外图像的显著性检测数据集。在新建数据集上的实验结果表明,本文所提出的方法可以显著提高图像显著性检测的精度。在视频显著性检测方面,考虑到可见光视频易受到天气、光照、复杂背景的影响,本文引入热红外视频信息,加入时空显著一致性约束,提出了一种基于时空一致性协同流形排序模型的多模态视频显著性检测方法。首先,本文充分利用单帧图像的多模态信息和模态权重计算出视频中的显著区域,并约束不同模态之间的显著目标具有一致性。其次,本文提出一种“流处理”方式,批量且快速地检测出连续视频帧中的显著区域。对于单位处理的连续帧,本文设定合理的假设条件,并融入时空一致性约束,旨在更好地挖掘出视频中的时空相关性。最后,本文构建了一个标准的多模态视频显著性检测平台,包括:视频数据集,基准方法和评价标准。本文利用该平台进行了广泛的对比实验,鲁棒的结果验证了本文算法的合理性及有效性。