论文部分内容阅读
当今时代,随着信息数据量激增和计算机技术的迅速发展,图像检索技术作为一种高效的信息查询手段的优越性也日益彰显。本文主要研究特征提取、特征量化建模和关联反馈算法在基于内容的图像检索(CBIR)系统中的运用。对图像进行多种特征提取可以弥补单个特征在描述图像特征过程中的表述单一,描述不完整等缺点。为了得到高效的图像特征描述符,本文在图像多特征提取过程中侧重于研究如何建立高效的特征模型以及对特征向量的量化算法。除此之外,关联反馈技术也是图像检索过程中的一个重要环节,它要求分析与用户提供的反馈数据并利用逐次迭代来优化查询初始向量和查询模型。但是在实际运用中,一次反馈过程包含的反馈信息量不足仍然是CBIR系统面临的难题。本文在关联反馈技术的研究过程中侧重研究扩充用户反馈过程包含的信息量并设计利用未标记图片来弥补模型训练数据不足问题。在实验部分,本文利用了两个开源数据库对提出的算法进行了相关测试分析,并证明了提出的算法可以达到良好的实验效果。本文的主要内容包括:(1)论文对CBIR检索技术的基础理论和最近的研究成果的进行了归纳总结。本文阐述了CBIR发展状况和基本流程,研究和分析了主流的图像底层特征提取技术、特征的量化与降维技术和关联反馈技术的研究现状与不足之处。(2)通过对图像多特征融合技术的分析,本文设计利用SIFT、HOG和Opponent-Color模型对图像的纹理、形状和颜色特征进行建模。为了保持各个特征之间的独立性,本文设计首先对单个特征进行分开特征提取与建模最后融合成完整的图像特征描述符。在特征量化过程中,本文利用视觉池袋模型BOF对特征进行建模和LLC对图像特征进行局部线性编码,接着使用池化和空间金字塔模型对图像进行更高一层次的特征建模。为了验证本文提出的图像特征提取算法的性能,本文通过Corel-1K和INRIA Holiday两个数据库对提出的算法进行了相关性能测试和分析。(3)论文采用基于SVM分类模型来实现图像检索过程中的关联反馈算法设计。在实际运用中,模型训练过程往往会由于带标记的训练样本的数量不足导致模型的不稳定。为了获取更多的训练样本,本文设计了一种特征子空间划分算法(FSP)和伪标记策略来构造伪标记概率估计函数(P(I)),实现来利用未标记的图像数据来训练模型。除此之外,由于信息检索系统软件平台等因素的限制导致单次反馈过程中来自用户的反馈信息量十分有限,本文提出了基于一种活动选择策略来选择最具有信息量的图片返回给用户进行标记,从而最大化一次反馈过程的反馈信息量。本文通过实验验证了相对基线,本算法在有限的几次反馈过程中获得的查询精度要高出大约15%,而且通过对比其他三种类似的基于SVM模型的反馈算法,本算法达到查询平衡点所需的反馈次数最少。(4)本文对影响实验效果的参数进行了分析。在提出的研究算法中,实验参数对CBIR检索性能的影响主要在视觉池袋模型大小的取值和伪标记估计函数阈值的选择两个方面。本文分别在两个开源数据库对相关参数进行实验分析,并取其最优值为实验过程的参数。