论文部分内容阅读
图像场景分类是图像理解中高层语义的重要研究内容,旨在通过分析图像的全局统计和关联特征,实现图像场景的语义标注。作为计算机视觉领域的一个重要分支,场景分类可以在很多场所有重要和广泛的应用。由于传统的单纯依靠人工分类的方法明显不能够满足要求,自动化的场景分类应运而生。近年来,针对场景分类算法有了很多的研究,这些算法都在不同程度存在一定的缺陷,比如:Gist特征不能够很好地把图像的局部信息描述清楚,局部Gist特征存在计算困难等。在本文中,提出了一种基于改进的Gist特征的方法,用来提取图像的特征,在此基础上结合PHOG特征进行图像的场景分类,设计场景分类系统。该系统可以很好的应用于场景分类中。针对不同的场景分类要求,主要做了以下几个方面的工作:1.本文首先介绍了Gist特征,在此基础上测试了采用不同规格的网格来划分场景图像,之后用滤波器组来对图像进行滤波,级联之后得到图像的描述特征。为了提高场景分类的正确率,本文采用更为细化的网格划分场景图像,通过实验测试得到最适合的网格划分图像,为后续的场景分类系统中划分合适的网格给出了解释。2.详细地介绍了如何提取改进Gist特征。将改进的Gist特征与PHOG特征进行组合,发挥PHOG特征的优势,弥补Gist特征的不足之处,用组合的向量来描述图像场景,使得图像场景中的信息能够得到更好的描述。以此为场景描述的基础向量,通过机器学习中的训练分类器,得到场景分类模型,最后进行场景分类测试。3.本文将场景分类首先区分为自然-人造场景两类,使用现有的二类分类器对场景进行两类分类。与现有的几种场景分类方法进行了对比,实验结果表明本文的方法能够有效地提升场景分类的正确率,对于自然场景-人造场景分类其正确率可以提升至96.84%。在多类分类系统中,为区别于以往的一对一或者一对多的分类模型,本文设计的是多级分类系统,首先进行基于特征组合的自然场景与人造场景分类;在此基础上采用对自然场景和人造场景中每一小类别训练出不同的分类器,将这些分类器按照不同的设置组合成一个场景分类系统,完成场景分类系统的整体设计。同样的与现有的集中分类方法进行了分类的对比,结果显示本文所提出的分类系统在分类时间和分类正确率上均较其它几种方法有一定的提升。通过对人造-自然场景分类以及多类场景分类的测试结果进行比较和分析,表明本文方法具有可行性。