论文部分内容阅读
基于内容的图像检索(Content-BasedImageRetrieval,简称为CBIR)技术发展到今天,在取得一定成功的同时,也面临着极大的挑战。如何提取能充分表达图像内容的低层特征,以及如何在图像的低层特征和高层语义之间建立关联一直是基于内容图像检索技术中尚未完全解决的问题。支持向量机方法(SupportVectorMachine,简称为SVM)是近年来兴起的一种基于结构风险最小化的机器学习方法,在模式识别的许多领域都有很好的应用。本文主要研究在图像识别、图像分类、图像检索这一特定领域,利用支持向量机良好的泛化能力,借助图像的的低层特征表示,学习图像的高层类别属性,并以此为基础,尝试构建能部分表达高层语义的图像特征表示,从而提高检索系统的识别能力,使其能够真正达到实用。
论文首先研究了图像的低层特征表示问题。各种基于颜色直方图的图像特征表示在基于内容的图像检索中有着广泛的应用,但它们的高维特性引发的昂贵计算代价却限制了它们的进一步应用。论文剖析了现有的多种各具特色的基于颜色直方图的图像特征表示在用于图像识别时的冗余性,并在不损失这些高维图像特征表示识别能力前提下采用主成分分析方法有效消除其冗余性。
彩色图像自动归于语义类别的研究对于在大型图像数据库中图像的浏览和检索有着重要的意义,但借助低层视觉特征进行图像自动分类又是一项难度很大的工作。支持向量机方法将分类问题和回归问题转化为二次规划问题,使分类更加精确,克服了传统分类方法如神经网络等的结构和权重的不确定性等缺点,但同时也增大了计算量。论文提出了一种基于压缩颜色直方图和支持向量机的彩色图像自动分类策略,采用五种不同的基于颜色的直方图特征向量表示彩色图像的内容,采用主成分分析方法消除高维直方图特征向量的噪音(不相关信息),并降低特征向量的维数,再把降低维数以后的直方图送进支持向量机训练分类器,利用支持向量机方法从这些基于颜色的图像低层特征表示中学习图像的类别特征,并进行彩色图像的自动归类。论文的研究成果可以一方面可以在提高系统识别能力的基础上有效减少相关反馈的计算代价,提高系统的响应速度;另一方面较小的特征向量维数使得系统在可用样本较少的情况下也可以重新分类,因而能有效改进基于内容的图像检索系统的的可用性。
基于内容的图像检索无法真正支持基于语义的图像检索,其关键性的局限在于只涉及了图像视觉特征,而没有利用知识进一步挖掘图像的语义内涵。论文提出一种基于支持向量机分类器的图像潜在语义特征(SVMsClassifierBasedImageDescriptor,简称为SCBID)的提取方法,结合SCBID特征和不同用户的不同检索目的,论文提出三种不同的的图像检索策略。SCBID特征提取方法在继承了传统低层图像特征表示固有优点的同时,借助支持向量机强大的学习能力融合了图像的类别属性以及语义信息。实验结果表明基于SCBID方法的三种检索策略其检索效果尽管略有不同,但都好于传统的基于直方图的检索策略,并能实现一定程度的语义检索,而且这种基于机器学习方法的特征提取减轻了检索系统相关反馈对用户的过度依赖,另外,较之传统直方图SCBID特征极低的维数也大大降低了随后的相似性度量的计算复杂度。实验结果也表明,SCBID方法依赖于聚类算法。
论文分别考察了五种不同的基于颜色直方图的图像特征表示在利用支持向量机进行彩色图像自动分类时的冗余性和有效性。不同的图像特征表示在用于分类时效果各有不同,其特点依赖于数据的,很难从中选择某种表示方法完全替代其他方法。这也就论证了为什么有这么图像特征表示活跃在当前研究领域。