论文部分内容阅读
随着多媒体技术的迅速发展,图像数据呈爆炸式增长,如何快速有效地获取和管理这些图像信息,已经成为了目前科学领域及工业生产领域的研究热点。图像的分类和标注作为处理海量图像数据的关键技术,能够在很大程度上解决图像数据自身的这种无序化问题,有着巨大的研究和应用价值。图像标注又可以被看作是一种分类问题,因此,本文主要研究基于分类方法实现的图像标注。而在目前的分类方法中,支持向量机(Support Vector Machine, SVM)在解决小样本、非线性以及高维的机器学习问题中展现出很多独特的优势,被广泛应用在图像分类领域。因此,本文重点研究基于SVM分类器的图像标注,并围绕着图像的单标签标注和多标签标注两个方面进行了研究。主要研究内容如下:在基于SVM分类器的单标签标注方面,本文提出了一种基于泛化的直方图相交核函数的多特征结合的图像分类算法。首先,针对单一特征只能片面地描述图像的部分属性,缺少足够的区分信息,图像分类准确率不高的问题,本文提出了多种特征相结合的思想。其次,本文对SVM分类器中的核函数进行了研究和优化,提出了一种新的核函数:泛化的直方图相交核函数。最后,本文采用提出的算法对图像进行分类,实验结果表明本文算法的平均分类准确率高于其他方法。在基于SVM分类器的多标签标注方面,本文深入地研究了多示例多标签问题,并提出了一种基于人眼感知度的示例生成方法。该方法在构造多示例的过程中,首先对图像进行分块,然后计算各个分块的人眼感知度权值,并使用权值来区分其对人眼视觉感知的重要程度。最后将生成的多示例与MIML-SVM(Multi-Instance Multi-label SVM)算法相结合,用以解决复杂的自然场景图像的多标签分类问题。实验结果表明,本文方法的各项分类性能指标均得到了改善,从而证明了基于人眼感知度的示例生成方法的有效性。