论文部分内容阅读
场景分类也被称为场景感知、场景识别,是计算机视觉和认知科学领域的一个具有挑战性的研究问题。场景分类根据给定的语义类别对图像数据库进行标注,为指导目标识别等更高层次的图像理解提供了有效的上下文语义信息。近年来的生理学实验表明:生物视觉系统依赖于选择性注意力,结合视觉记忆,快速理解场景内容,即图像显著性与场景语义理解是紧密相关的。因此,显著检测与场景分类相结合具有重要意义。本文以静态图像为研究对象,在研究显著区域检测方法的基础上,通过中层语义的TMBP(Topic Model by Belief Propagation)主题建模,着重研究了基于前景和背景的TMBP场景分类三个方面的内容。论文研究内容如下:1)针对多目标图像检测存在的误检问题,结合低层特征和中层提示,提出一个新的贝叶斯框架下的多目标显著检测方法。该方法首先用上下文感知显著检测方法获取图像的低层特征信息,然后用Ncut(Normalized cut)图像分割取得图像的显著中层信息提示,即多目标的类别标签信息,根据低层和中层信息提示来计算先验显著图,最后使用贝叶斯方法计算获得图像的后验显著图。实验结果表明,本文方法提高了显著对象检测精度,并且可以较好的解决多目标检测误检问题。2)针对现有的基于LDA(Latent Dirichlet Allocation)模型的图像场景分类方法存在的计算速度慢和复杂度高的问题,采用基于信任传递的推理方法的TMBP主题建模。该模型以LDA模型为框架,不同于传统的VB(Variational Bayesian)和GS(Gibbs Sampling)推理方法,采用信任传递的近似推理方法,提高了推理的速度。实验结果表明,TMBP主题建模的场景分类方法要比传统的VB-LDA和GS-LDA更快,计算复杂度也更低。3)针对基于主题建模的图像场景分类方法存在的分类准确率低的问题,提出分别基于前景和背景的TMBP主题建模场景分类方法。该方法首先用显著检测方法提取图像的显著区域作为前景,然后分别对前景和背景分别建模,从而实现场景分类。实验结果表明,基于前景和背景的TMBP场景分类方法要比传统的主题建模方法分类准确率更高。