论文部分内容阅读
随着计算机信息技术的发展,各种海量的图片、视频作为沟通交流的载体成为重要的信息表现方式。神经生物学学者发现在面对这些海量信息时人类视觉系统能够快速和自适应地筛选出场景中的感兴趣目标,对它们集中处理。这就是人类视觉系统的选择注意机制,而人类的感兴趣目标就是显著性区域。由此,将人类视觉系统快速筛选感兴趣目标的能力用在计算机上,使计算机能够自适应理解并处理视频。近几年,基于时空的显著性检测发展很快,但还处于初级阶段,现有的时空显著性检测方法得到的显著图背景冗余信息较多,细节信息不够明显,并且对于不同运动模式的场景适应性较差,为了解决这些问题,本文深入研究现有的时空显著性检测算法,具体工作内容如下:首先,提出了一种基于低水平显著性融合和测地线的视频显著性检测方法,分别提取时空边缘显著图和平滑的空间颜色显著图,将它们进行融合,得到低水平的时空显著图,通过后续帧到背景区域的测地线距离得到高精度时空显著图。选择SegTrack V1、SegTrack V2和ViSal作为实验数据集,和其他11种近几年算法做实验对比,主观结果表明本文算法很好地消除了背景冗余信息,同时边缘信息和内部细节信息也更加清楚,客观评价结果也普遍比其他方法好。其次,针对上述提出方法适用场景比较狭窄的问题,提出一种基于最小方向对比度和时空背景先验的显著性检测方法,该方法分别计算最小方向对比度显著图和时空背景先验显著图,然后将两者进行融合得到最终的时空显著图。该方法适用于背景更为复杂的场景以及多种运动模式的场景。在FBMS、MCL和DAVIS三个公开视频数据集上实验,并且与显著性模型:MCT、MDC、SAG、GF和STBP进行实验对比,主观和客观结果表明提出的算法较好地提取了目标的显著性区域,在适用性和准确性方面都具有优势。