论文部分内容阅读
随着电子技术和计算机技术的发展,使得每天都有大量的图像信息产生,如何有效地对迅速膨胀的图像进行分类、检索和管理已成为国内外研究的热点问题。近年来,基于内容的图像检索技术(Content-based Image Retrieval :CBIR)的发展较大得提高了图像检索效率,它通过分析图像底层视觉特征的相似性来检索图像,大大改善了基于文本的图像检索技术中,依赖于人工对图像进行标注所带来的各种严重问题。但是它却不能满足普通用户按语义检索图像的需求。基于图像底层视觉特征将图像按语义进行合理的分类,将较大提高CBIR系统的性能。然而,由于各特征的高维特性引发的昂贵计算代价限制了它们的应用。为了解决图像检索及分类中面临的“维数灾难”问题,主成分分析模型(Principle Component Analysis: PCA)成为近年来使用较多的图像特征降维算法之一。但是,PCA在降低维数的同时也会丢失一些对图像分类有用的关键信息。PCA抽取的主成分是依据图像特征矩阵特征值大的而保留下来的,可以保留原始矩阵较大的变异信息,但它对分类的贡献却不一定是最大的,而一些对类别的正确识别非常重要的特征,反而在维数约减的过程中被滤掉。针对上述问题,在扩展PCA模型的基础上,我们提出了一种新的图像分类模型(Image Classification Model based on Extended PCA:EPCA)。本文较为详细的介绍了EPCA模型的原理,并在WANG database图像集上验证本文提出的EPCA图像分类模型的可行性并与其它经典分类模型的性能进行了比较。根据我们的实验结果,EPCA模型是一种可行的、有效的图像分类模型,取得了比KNN模型更好的分类效果,与目前在图像分类中表现优越的SVM模型性能相当。本文的工作和创新主要有以下两点:1.通过研究和分析PCA模型的特点,扩展了该模型,并在此基础上提出了一种新的图像分类模型:基于扩展PCA图像分类模型(Image Classification Model based on Extended PCA: EPCA);2.在公用的图像数据集WANG database上,验证和分析了EPCA模型的分类性能,讨论了成分数对EPCA模型的影响以及与其它分类模型的性能比较问题。