基于词袋方法的图像检索系统的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:suddysand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索是多媒体信息检索领域的一项新兴技术。和传统的基于标注的图像检索方式相比,它具有客观,自动高效等优点,有着非常广阔的应用空间。目前,大多数基于内容的图像检索系统提取的是图像的全局特征。全局特征提取方法虽简单通用且能够获得某种不变性,但当图像发生了变形,局部遮挡、扭曲等仿射变换时效果却非常不理想。而局部特征通过提取图像局部区域的信息构成特征向量,可实现较好的匹配结果。由此,基于局部特征的图像检索成为当前图像检索领域的一个研究热点。  本文研究了当前基于局部特征的图像检索主流方法词袋方法(bagofwords)。词袋方法的出现使检索不再需要对数据库中的图像进行一一匹配,从而大大加快了检索的速度,使检索系统能够拓展到大的数据集。词袋方法即是借鉴了文本检索的一些思想和相关技术,将图片处理成是一组视觉虚拟词的结合(相当于文档分词为词的集合),然后应用倒排索引,相关性排序等文本检索的技术来检索相关图片。本文对其中的关键部分进行了研究,提出了一种改进的基于多特征的检索方法,并实现了相关图像检索系统进行效果验证。  在词袋方法中,由于在特征提取,虚拟词典的训练等过程中都有图像信息的丢失,导致最后有很多错误匹配以致于检索的准确率不高。本文提出了多特征的匹配及索引方法解决了这个问题,多特征的方法使用多个特征来代替单个特征,确保了特征匹配的准确性,并在之后的检索模块中,整合能够增强检索查全率的SOFT(softassignment)方法,使检索系统在查全率方面也有一个较好的表现。  在之后的实验中,本文尝试了几种可能的多特征的结合方法,选取了最优的方法与参数,并在oxfordbuilding数据集中与词袋方法做了一个对比。实验证明,基于多特征的方法约有10%平均检索准确率(MAP)的提高。  与现有的词袋方法相比,本文所提出的多特征的方法在不损失检索速度的情况下,消除了大多数的错误匹配,提高了检索的准确率,能够满足实用需求。
其他文献
视频监控是模式识别和计算机视觉领域的主要内容之一,在军事、医学和科研等领域得到了广泛的应用。视频监控系统中运动物体检测与跟踪算法的设计是系统的核心,因此,研究视频
在科学研究和工程技术等方面,有大量的问题需要建立相应数学模型,来描述个抽象系统的输入输出关系。要想对复杂系统的观测数据建立能够精确反映数据间内在规律的数学模型,用
软件定义联网(SoftwareDefined Networking,SDN)技术实现了网络控制平面与数据平面的分离,具有良好的可控可管理性。SDN的集中式控制提供了全局网络视角,为数据中心网络负载
遗传算法(Genetic Algorithm,GA)是由John Holland于1975年提出的一类进化类优化算法,对于传统方法难于求解的组合优化、非线性优化等复杂问题,使用GA求解能得到令人较为满意的解。GA所具有的鲁棒性、全局性、并行性等特点,使其日益受到广泛关注和应用。在综述前人工作的基础上,本文对简单遗传算法(SGA)的特点进行了分析,并提出了具有参数自适应特性的改进遗传算法(AGA)。
现阶段的入侵检测技术在现实使用时仍有很多的不足,比如存在较高的误报和漏报率、很低的检测效率和较低程度的智能化等问题。为了解决这些问题,研究者将研究的重点集中在合适
近年来,随着计算机技术的发展,计算机仿真作为研究问题的新方法,越来越受到学者们的重视。通过将问题抽象为程序模型在计算机中进行运算,可模拟现实情况,据此给出建议和参考信息,并
近年来,无线传感器网络获得了快速的发展,并以其低成本、大规模和自组织的特点带来了信息感知的一场变革。在无线传感器网络中,传感器节点自身位置信息的获取对各种应用而言
数字化作品具有易存储加工和易传送等特征,使知识的传播和交流更为方便,但同时也为某些非法者恶意篡改,攻击和窃取别人作品提供了便利条件。因而,如何保护数字媒体信息安全已
近几年来,随着网络技术的迅速发展,能够随时随地进行通信的移动网络受到越来越多的关注。在一些特殊、紧急的环境下进行网络通信日益重要,Ad hoc网络正是在这种背景下产生的。但
图像发排控制技术是在数控技术和计算机技术的基础上发展起来的一种自动化控制技术。该技术综合了嵌入式、机械设计、光学、电子、图像处理等相关技术,以机械速度、位置、扭