论文部分内容阅读
室内场景分类是场景分类的一个研究领域,同时也是场景分类的一个研究难点。如有效解决室内场景分类精度低的问题,将有助于室内场景分类在场景图片检索、视频检索及机器人等领域的应用。因此,室内场景分类的研究具有重要的意义。当前应用室内场景分类主要两种特征模型:第一种是David G等人提出的空间金字塔模型以及Bosch A等人提出的金字塔梯度直方图模型;第二种是Oliva等人提出的场景形状整体空间包络模型。本文提出了一种局部特征和全局特征融合的室内场景分类方法。这种方法结合了局部特征的细节性和全局特征的全貌性,适当提高了室内场景分类精度。首先,本文综述了室内场景分类相关的背景知识,以及它的研究意义;分析了室内场景分类的研究现状。其次,本文阐述了获取尺度不变特征转换(SIFT, Scale-invariant feature transform)的详细过程,Gist特征概念及获取的过程,PHOG (Pyramid Histogram of Orientated Gradients)特征概念及获取过程,SVM分类器,PCA(Principle Component Analysis)降维。其中SIFT特征和PHOG特征属于场景图像的局部特征,Gist特征属于场景图像的全局特征。另外,本文还阐述了在多特征下进行多特征融合的方法。第三,本文提出了改进的SIFT特征提取方法。经典空间金字塔模型在提取场景图像SIFT特征时,会生成n*128维的特征矩阵,其中n为关键点的个数,也就是矩阵行数,128为关键点的特征维度。这种情况下场景图像特征矩阵存在大量0元素,从而导致场景分类精度很低。为此,本文根据关键点位置进行聚类处理,再提取SIFT特征,得到统一维度的SIFT特征矩阵后再进行降维处理。另外,本文详细阐述了Gist特征和PHOG特征获取的具体的步骤、详细分析了多特征融合的室内场景分类方法的整体架构及具体研究了室内场景多特征的生成。第四,本文进行了实验与结果分析。首先进行了室内场景图像的训练集和测试集占比的实验,从实验得出最佳的占比,这有助于室内场景分类;然后进行了室内场景分类实验,通过对比可以得出相比单一特征的室内场景分类,多特征的室内场景分类确有优越性。最后在前两个实验的基础上,进行改进的多特征融合的室内场景分类实验,来进一步提高室内场景分类的精度。最后,本文总结了所做的工作,并对于当前研究内容进行了展望,提出需要改进地方,为下一步研究做指引。