论文部分内容阅读
随着人类进入信息化社会,国际互联网的快速发展使得信息量以指数化的速度增长,互联网上大量未被分类的数字图像作为一个巨大的挑战摆在了人们面前,传统的人工手动图像标注和分类不仅在时间上而且在效率上都不再能够适应要求,这就需要自动的图像类别标注和分类方法来应对这一挑战。近年来,词袋算法在图像自动分类领域取得了巨大的成就,然而经典的词袋算法在特征提取和图像表示阶段仍然存在着一些不足,因此对于经典词袋算法的改进是本文的研究重点。 本文提出了一种基于改进的词袋模型图像分类算法,主要工作如下: 首先针对经典词袋算法对图像提取的SIFT特征数目不稳定的不足,对图像分块,对每个图像块提取SIFT特征能够提高SIFT特征稳定性;单一特征无法全面表征图像信息,本文结合SIFT特征和方向梯度直方图特征,将两种特征融合进行特征提取。 其次在获取图像的表示阶段,提出一种与距离次序有关的权重分配方法,使得到的图像表示更加准确,针对经典的词袋分类算法丢失了图像空间信息的这一不足,将与距离有关的权重分配与空间金字塔相结合,形成了新的词袋模型图像分类算法。 本文使用Caltech-101数据库和15Scenes数据库对所提出的图像分类算法进行验证,并与经典的方法进行了比较,实验结果表明在上述数据库上,本文算法的分类准确率较经典的算法准确率高。