论文部分内容阅读
近年来,图像显著性检测作为计算机视觉中的重要组成部分,被广泛地应用于图像检索、目标识别、图像压缩等众多领域。图像显著性检测模型通过模拟人类视觉系统,提取图像中人们关注度高的区域,能极大地提高图像后续处理的效率,同时使处理的过程更具有针对性。通常,通过提取图像低层特征计算对比度或使用机器学习等方法来构建显著性检测模型,未考虑人眼视觉等高层特征,其检测的结果与人眼感知有一定的误差。眼动追踪技术通过记录人眼的运动信息,能反映人们关注度较高的图像区域,为了解人眼视觉感知和真实意图提供了依据。因此,本文提出了一种基于眼动的图像显著性检测模型,眼动信息被考虑作为先验信息加入到检测模型中,能提高检测算法的性能,使检测的结果更加贴合人眼感知。本文的主要工作有:1)构建了MSRA-1000眼动数据集。采集了10位观测者观看MSRA-1000数据集中的1000幅图像的眼动数据,对眼动数据进行了预处理,为后续研究奠定了基础。2)提出了基于眼动的超像素分割算法。使用眼动显著值对简单线性迭代聚类算法(SLIC)进行优化,将该算法应用在现有的显著性检测算法上,实验结果表明优化后的SLIC算法能有效的提高后续计算的效率。3)提出了一种基于眼动的图像显著性检测算法。该算法采用了一种基于眼动的训练样本选择策略,使用多核增强学习的方法训练图像特征构建了一个分类器作为显著性检测模型,最后将基于学习的显著图和基于统计的显著图相结合,使用多尺度策略进行优化。本文在MSRA和DUT-OMRON两个公开数据集上对提出的显著性检测算法与现有的10种显著性检测算法进行对比实验。在AUC、P-R曲线以及F-measure三种评价标准上,本文算法的性能均优于其他算法,验证了本文算法的优越性。