基于流形学习的图像检索技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:mhy8348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索是当前互联网时代的基本需求。基于内容的图像检索(Content Based Image Retrieval,CBIR)是图像检索领域的热点研究方向。CBIR利用图像低层视觉特征进行图像的对比和检索,成功克服了关键字图像检索方法存在的关键字描述不准确、检索效率不高等问题,并具有易于自动化、智能化的特点。被广泛应用于互联网图像搜索,人脸识别等领域。传统的CBIR系统通常有特征提取、维数约简、相似性对比、检索结果分类等几个主要环节,主要存在“维度灾难”和“语义鸿沟”等问题。解决“维度灾难”问题主要通过使用降维技术来完成。而针对“语义鸿沟”问题,目前在CBIR中比较主流的是采用相关反馈技术(Relevance Feedback, RF)进行处理,通过利用人的主观认知能力来提高CBIR系统检索的准确性。本文针对CBIR系统中存在的这两个问题进行了深入的研究。本文主要工作如下:(1)深入分析了当前CBIR系统的国内和国际研究发展现状,并对存在的问题进行了讨论。其中对“维度灾难”和“语义鸿沟”问题的定义、产生的背景及原因等方面进行了详细的介绍。(2)对CBIR系统中所涉及的主要技术进行了详细的介绍,其中图像特征提取,检索结果分类算法作为背景知识简略介绍,重点对和本文研究内容相关的降维算法、相关反馈和检索结果评分进行了详细的介绍并进行了深入的分析,对其中存在的主要问题进行了介绍。(3)流形学习是降维算法中的热门方法,本文对流形学习的发展历史进行了简单的回顾,并对其中基于图结构的相关算法,例如局部线性嵌入(LLE),局部切空间排列(LTSA)等算法进行了介绍。同时,针对高维空间中存在的局部高曲率现象,本文提出了弯曲的线性局部切空间排列算法(WLLTSA),通过使用角度度量方法较好的解决了高维空间中的局部高曲率现象。并通过大量的实验进行了验证。(4)检索结果评分是基于RF的CBIR系统中的关键环节,检索结果评分效果的好坏直接影响到图像检索的效果和准确率。本文对目前常用的相似性度量方法进行了简单的介绍,并对基于流形评分(MR)的直推式评分方法进行了介绍。针对Nie等人提出的LRGA算法存在的未充分利用反馈样本信息的问题,提出了ULRGA检索结果评分算法,通过实验对比表明ULRGA评分算法取得了良好的评分效果。
其他文献
医学图像多相分割与多器官的三维重建在计算机辅助诊断及虚拟手术中有着重要的应用,但由于医学图像本身的复杂性和多样性,经典的图像分割技术无法满足实际需求。本文对平面上
网络上的信息增长和更新速度越来越快,同时存在大量重复的垃圾信息,这些都给人们获取有效信息带来了不便。传统搜索引擎一方面只能返回大量相关网页或文档,另一方面,基于关键
肝脏作为人体内极为重要的解毒器官,近些年来由于生活质量的提高,大量饮酒或饮食不当导致的脂肪肝等病症越来越多,一旦没有得到及时治疗很容易发展成为肝脏肿瘤,所以针对肝部
随着社会科技水平不断提高,身份鉴别的准确性、实用性、安全性等方面受到了人们越来越多的关注,传统的身份识别方法已不满足现实需求。由此,大量学者们一直在致力于寻求一种
基于场景的软件需求建模技术是软件需求工程中被证明最有效和被广泛采用的建模技术之一,但场景建模方法中软件需求描述模糊、不一致问题影响了其使用效果,场景可视化描述可显
半监督学习是机器学习中一个重要的研究领域。半监督学习通过使用少量标记数据并辅助以大量未标记数据进行学习,在尽可能减少人工标注代价的前提下尝试提高学习器的性能。基
时间序列通常是针对某一统计指标进行采样获得的观测结果,它反映了该统计指标随时间的变化情况。时间序列的特点是数据规模大、数据维度高、连续更新等。随着时间序列数据的不
本文主要研究交通流量的检测。在目前的各方法中,视频检测是研究得最多的一种方法。视频检测是建立在机器视觉的基础之上的。机器视觉是在图像处理的基础上发展起来的新兴学
随着信息科学技术的快速发展,人脸识别技术在信息安全领域承担着越来越重要的作用,应用于安全监控、电子商务、安全防务等领域的前景越发广阔。但实际应用中易受光照、遮挡、姿
现实问题中的数据通常是高维的,其中存在大量的不相关和冗余的特征,这给传统的学习算法带来了巨大的挑战。特征选择就是在这种情况下应运而生,是一种有效的降维方法。特征选