论文部分内容阅读
Bagoffeatures方法自从2003年提出以来,在计算机视觉领域特别是图像分类和图像检索上得到了广泛的应用。它将每幅图像的局部特征集合映射成一个视觉词汇频率分布的直方图,使得图像仅需要使用一个直方图向量描述即可。但是,低维度的BOF向量缺乏辨识能力。为了保留足够多的信息,向量的尺寸一般维持在1000~4000维。这不仅导致了存储空间和计算时间上很高的复杂度,而且高维向量的“维数灾难”问题,使得高维索引方法随着维数升高性能急剧下降。因此,有必要在使用BOF向量之前先对其进行维数约简,而传统的PCA线性降维算法无法反映出数据之间所隐藏的非线性性质,在低维情况下对BOF向量的分类和查询性能有较大影响。针对这种情况,本文提出了一种新的基于统计流形的非线性降维算法,能够在保证数据信息足够完整的条件下合理的约减BOF向量的维数。本文利用BOF向量本身是概率密度函数这一特点,引入fisher信息距离作为相似度度量标准,然后使用MDS算法将统计流形空间的距离信息嵌入到低维欧式空间,得到BOF向量的低维嵌入。本文将这种新的BOF降维方法与传统的PCA方法进行了对比,并在多个图像集上做了实验。实验结果表面我们的方法更有优势,能够在保证分类和检索上效率和准确率的基础上,得到更低维的向量。