论文部分内容阅读
图像检索是当前互联网时代的基本需求。基于内容的图像检索(Content Based Image Retrieval,CBIR)是图像检索领域的热点研究方向。CBIR利用图像低层视觉特征进行图像的对比和检索,成功克服了关键字图像检索方法存在的关键字描述不准确、检索效率不高等问题,并具有易于自动化、智能化的特点。被广泛应用于互联网图像搜索,人脸识别等领域。传统的CBIR系统通常有特征提取、维数约简、相似性对比、检索结果分类等几个主要环节,主要存在“维度灾难”和“语义鸿沟”等问题。解决“维度灾难”问题主要通过使用降维技术来完成。而针对“语义鸿沟”问题,目前在CBIR中比较主流的是采用相关反馈技术(Relevance Feedback, RF)进行处理,通过利用人的主观认知能力来提高CBIR系统检索的准确性。本文针对CBIR系统中存在的这两个问题进行了深入的研究。本文主要工作如下:(1)深入分析了当前CBIR系统的国内和国际研究发展现状,并对存在的问题进行了讨论。其中对“维度灾难”和“语义鸿沟”问题的定义、产生的背景及原因等方面进行了详细的介绍。(2)对CBIR系统中所涉及的主要技术进行了详细的介绍,其中图像特征提取,检索结果分类算法作为背景知识简略介绍,重点对和本文研究内容相关的降维算法、相关反馈和检索结果评分进行了详细的介绍并进行了深入的分析,对其中存在的主要问题进行了介绍。(3)流形学习是降维算法中的热门方法,本文对流形学习的发展历史进行了简单的回顾,并对其中基于图结构的相关算法,例如局部线性嵌入(LLE),局部切空间排列(LTSA)等算法进行了介绍。同时,针对高维空间中存在的局部高曲率现象,本文提出了弯曲的线性局部切空间排列算法(WLLTSA),通过使用角度度量方法较好的解决了高维空间中的局部高曲率现象。并通过大量的实验进行了验证。(4)检索结果评分是基于RF的CBIR系统中的关键环节,检索结果评分效果的好坏直接影响到图像检索的效果和准确率。本文对目前常用的相似性度量方法进行了简单的介绍,并对基于流形评分(MR)的直推式评分方法进行了介绍。针对Nie等人提出的LRGA算法存在的未充分利用反馈样本信息的问题,提出了ULRGA检索结果评分算法,通过实验对比表明ULRGA评分算法取得了良好的评分效果。