论文部分内容阅读
近年来ˋ随着互联网及计算机技术的发展ˋ对海量多媒体信息的处理需求使图像检索图像分类图像匹配图像标注等计算机视觉技术逐渐成为研究热点目前ˋ这些研究需要解决一个共性的问题ˋ即通过图像底层特征的距离度量ˋ得到图像语义的相似度ˋ实现对图像内容的理解传统的距离度量方法缺乏对度量空间的选择变换ˋ忽略了背景环境和语义约束信息ˋ效果往往不太理想距离度量学习通过训练数据将特征空间的结构信息和语义约束信息融入到距离度量之中ˋ得到能够反映样本空间特性和语义关系的距离度量函数本文主要针对距离度量学习的算法复杂度问题不一致性问题以及视觉单词包模型ξBagofVisualWordsˋBoVW下的距离度量学习方法ˋ分别展开研究ˋ取得了如下研究成果ξ1目前主流的距离度量学习方法需要求解半正定规划问题ˋ其算法复杂度往往与特征维数的平方甚至三次方成正比为此ˋ本文提出了一种基于本征值最优化与特征分组的距离度量学习方法新方法将特征按其相关性进行分组ˋ将高维的视觉特征分为多组低维特征然后ˋ利用基于本征值最优化的距离度量学习方法对各低维特征组学习距离度量矩阵最后ˋ将各个度量结果进行融合ˋ以达到降低算法复杂度的目的在Corel图像库上的分类实验验证了该方法的有效性ξ2在距离度量学习中ˋ经常会有训练数据不足的问题ˋ此时训练数据的分布难以反应实际数据的分布ˋ利用训练数据学习得到的度量函数可能难以适用于实际数据为此ˋ提出了一种基于概率密度比值估计的距离度量学习方法新方法利用直接概率密度比值估计方法ˋ计算出训练样本与实际样本分布的概率密度比值然后ˋ将该比值引入近邻成分分析中ˋ对样本进行加权ˋ克服传统距离度量学习中训练数据和实际数据分布不一致的问题UCI数据集和Corel图像库上的分类实验验证了该方法的有效性ξ3在BoVW模型中ˋ由于特征检测的不足聚类算法的缺陷及视觉单词的量化误差ˋ产生的视觉词典存在视觉单词同义性和歧义性的问题ˋ因此用BoVW计算图像距离时ˋ效果不太理想此外ˋBoVW模型的词典规模巨大ˋ学习一个普通矩阵需要的运算量难以接受为此ˋ本文提出了一种基于SVM的BoVW距离度量学习方法新方法利用支持向量机ξSupport Vector MachineˋSVM训练一个将相似图像对与非相似图像对最大程度分离的超平面ˋ得到词频直方图点积的对应维权重该权重组成的对角阵就是所需的度量矩阵ˋ更好地度量图像间的相似度Oxford图像集上的检索实验验证了该方法的有效性