论文部分内容阅读
图像对象分割就是从一幅具有复杂背景的图像中将感兴趣的对象提取出来,是图像分割技术的最高目标,是结合了识别过程的图像分割。图像分割技术几乎出现在所有与图像相关的领域,具有广泛的应用需求。另外图像分割的好坏直接关系到图像分析和图像理解,关系到是否能圆满完成视觉任务。因此对图像对象的分割理论和相关技术进行研究具有十分重要的意义。本文建立了一个完整的图像对象分割系统,该系统在没有任何人工交互的情况下完成了对图像中对象实例的精确分割。本文的分割系统主要由Bag-of-Words识别模型、提供空间信息的随机场、Dirichlet过程以及Gibbs抽样组成。其中Bag-of-Words识别模型是由图像特征提取和视觉词汇的构建这两部分支持的。Bag-of-Words模型能够成功的预测图像中是否存在要分割的对象,但是该模型不能精确的定位对象的边界。随机场可以描述图像像素或者图像patch(像素块)之间的空间信息,但是它不能提供对象识别所需要的图像上更大尺度的结构信息。于是我们在这些部分的基础上增加了Dirichlet过程,Dirichlet过程把图像看作是由多个区域组成的,每个区域代表一个单一的对象实例。用Gibbs抽样对测试图像的参数进行估计,从而完成图像对象的分割。首先我们基于图像的一种典型局部特征SIFT特征提出了一种SIFT的密集采样算法,即DenseSift,并用该方法提取图像的特征。接着实现了一种基于决策树的高效视觉词汇构建算法,用形成的视觉词汇表示图像。然后构建由Dirichlet过程、随机场和Gibbs抽样组成的对象分割模型,完成图像对象分割系统。最后将该系统应用于the TU Graz-02数据集,获得该数据集三类图像(car类、bike类和person类)的分割结果,并对分割结果进行分析。实验结果表明,本文的图像对象分割系统能够获得较好的分割结果。尽管图像往往具有复杂的背景,图像中对象的外观具有多变性,视点、照明等成像条件也经常发生变化,甚至还经常出现遮挡,本文图像对象分割系统仍然能够成功的将感兴趣的对象从图像中分割出来。