基于图像特征的最近邻搜索算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:z362523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的飞速发展,互联网的内容从文字逐渐向着图片视频等多媒体形式方向发展,特别是近年来移动互联网的普及使图片应用的限制逐渐减弱,有关图像的应用变得火热起来。在诸多图像应用中,图像检索作为基础,在实际应用中扮演着重要角色。尤其在当前互联网图片数量呈指数增长的情况下,快速检索到所需图像很有意义、也很有挑战性。针对这一挑战,传统的图像最近邻检索算法无法同时满足快速性和高精度的要求。为此,本文结合分段量化思想,加入文本检索中的倒排索引算法,提出了一种改进的最近邻检索算法,实现高精度、快速图像检索,为图像检索问题提供了新的解决方案,具体描述如下:  本文将倒排索引策略与量化思想结合,充分利用倒排索引结构对数据的分类特性,提高了图像检索的速度。在量化方面,从分段量化方法入手,通过分析向量量化过程中产生的误差、待检索向量以及量化后向量三者之间的关系,给出了一种真实距离的估计方法,在其基础上提出一种阈值限制策略,以达到进一步减少遍历量、提高检索速度的目的。具体来讲,本文算法首先根据三角不等式进行真实距离最大值阈值计算,通过迭代使阈值下降、直到比较接近真实距离。接着应用该阈值来进行遍历范围限制,即对于倒排索引结构来说,不再遍历固定数量的挂载点,而是先计算每个挂载点与待检索向量的距离,当阈值与挂载点的距离比较大时,认为此挂载点与待检索向量的距离较远而终止遍历;此种方式与之前的遍历方式相比,能更好的适应数据集的变化从而很大程度上减少了遍历量、提高了检索速度,同时保持了较高的的检索准确率。  本文提出的改进最近邻检索算法被应用来解决大规模数据集下的相似图像检索问题。在相似图像检索问题中,对图像表达和相似图像检索过程进行了优化:首先,针对基于神经网络的图像表达问题,在现有网络的基础上加入了微调操作;在特征提取阶段,利用微调后的网络提取特征来作为图像特征,从而保证在图像表达效果上优于传统的图像特征。在相似图像检索系统流程上,根据检索结果加入多特征重排序策略,即对于初次检索结果再利用颜色特征进行重排序,此策略解决了一次检索所出现的颜色差异较大的缺陷,进一步提升了检索效果。
其他文献
随着互联网技术的飞速发展和迅速普及,传统的分布式存储应用面临巨大的挑战。如何充分利用网络环境中的信息资源,成为互联网发展的关键。对等网络技术的产生为网络存储提供了新
回波信号是核磁共振测井的原始信号,也是地面人员获取地层信息的重要来源。原始回波信号极其微弱是核磁共振测井的特点之一,也是测量的难点之一。本文从影响回波信号的因素出发
对低分辨雷达来说,由于其仅能获取目标的回波起伏信息,因此要想用它来识别飞机的类型和架数有很大的难度。如果能找到一种有效的方法使现役的低分辨防空雷达具备自动目标识别
地面机动目标跟踪是指利用地面运动目标指示雷达GMTI获取的地面目标量测信息,以及道路、地形等先验信息对地面机动目标(如坦克、车辆等)的运动状态进行估计。地面机动目标跟踪在
伴随着人类社会经济的快速发展,工业企业的数量正在急剧扩张,工业企业生产过程中隐含的各种危险源事故数量也在不断增加,如何应对这些危险源事故正日益成为一个非常严峻的问题。
复杂物流系统是由若干个制造商、批发商、零售商等实体构成的网状供应链物流系统。系统中存在顾客需求、出品的供应、交纳周期等不确定因素,这就导致系统是一个多层次的连续-
以图像匹配为核心的景象匹配辅助导航系统与惯性导航系统组成的组合导航系统具有更高的精度和可靠性。在前人的基础上,本文针对此系统中的图像匹配算法展开研究,并且对所设计的
随着时代的发展,计算机网络迅速普及,由此带来的网络安全问题日渐严重,对于网络安全问题的研究也日益重要。分布式拒绝服务(DDoS)攻击的危害十分严重,其作为传统拒绝服务(DoS)攻
订单与库存关于需求的放大效应一直是供应链管理中的热点问题,其存在会带来供应链高额的运作成本。本文运用现代控制理论方法,在一类较为简单的供应链网络中定义了这种放大效应
随着市场竞争的日益激烈,企业与其供应商的关系更加复杂多变。同时,迅速变化的产业环境也使静态的供应商管理不能适应企业的长远发展。供应商的数量以及管理策略都会随企业所处