论文部分内容阅读
如今,网络多媒体技术正在迅猛地发展,各种图像数据库中的图像数量呈现爆炸式增长。如何对这些图像进行有效的管理与快速的检索是一个巨大的挑战。场景图像的分类正是解决这个问题的关键技术。本文针对图像特征提取、场景图像内容表述及其分类方面展开了研究。在基于视觉词汇的图像表述上,本文以词袋模型(Bag Of Words, BOW)在图像处理中的应用为背景,较为深入地研究了空间金字塔匹配模型(Spatial PyramidMatching, SPM)和潜在狄利克雷分布模型(Latent Dirichlet Allocation, LDA)的相关理论。在图像分类阶段,本文利用支持向量机(Support Vector Machine, SVM)分类器对场景图像进行了分类实验,实验结果显示,这三种模型都是基于单一的视觉特征来提取特征,并且在分类准确率、图像特征维数和图像分类时间上均有着不同的缺陷。针对上述三种模型的缺点,本文提出了一种融合颜色特征和SIFT特征的概率主题模型(Multi-Features LDA, MF-LDA)进行场景图像的分类。通过实验我们发现本文提出的模型在提高分类准确率,降低图像特征维数和图像分类时间方面均取得了理想的效果,为大规模地处理图像奠定了基础。