基于改进的多索引哈希的相似图片搜索系统的研究与实现

被引量 : 2次 | 上传用户:fso2084
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着互联网技术的发展,多媒体数据呈现出爆炸式的增长。面对海量的多媒体数据,如果我们不能对其进行检索,则无法对这些数据进行利用。与此同时,在一些场景中,传统的基于文本的信息检索技术无法很好地满足人们的检索需求,如检索相似的图片,检索声音片段的完整歌曲等。原因在于基于文本的信息检索技术存在文本表达能力不足、人力成本大等缺点。因此,类似图片、声音等比文字更为直观的信息检索变得越来越重要。本文的主要工作是设计和实现了一个基于改进的多索引哈希(Multi-Index Hashing)的大规模相似图片检索系统。系统的核心算法是多索引哈希算法,我们会将该算法应用到图片特征向量的k近邻搜索中。在实际的应用中,我们发现多索引哈希算法会在一些特定的情况下出现明显的性能损失。为了解决这个问题,我们对多索引哈希算法进行了改进。在建立哈希表索引之前,我们会对多索引哈希算法的默认哈希策略进行优化,即重排图片特征的二进制码数据的0-1值。通过对多索引哈希算法进行改进,我们能够在一定程度上解决上述所提到的性能损失问题。由于对多索引哈希算法进行并行化实现并不容易,为了能够使用现代CPU的多核计算能力,提高系统的吞吐量,我们采用多线程处理查询请求,单个线程串行执行多索引哈希算法进行查询的方案。为了能够实现这个方案,我们专门设计了一个无锁队列来减少数据同步所带来的额外开销,通过实验,我们可以发现比起传统的互斥锁队列,我们所采用的无锁队列有着明显的性能优势。在论文的最后,我们会对我们的系统进行简单的功能展示。虽然目前系统还只是处于demo的阶段,但是我们依然可以发现系统的检索效果是让人满意的,检索速度可以满足项目的需求。
其他文献
根据国内外学者研究高速铁路开行高速快运列车的现状,总结德国、法国和欧洲快捷铁路物流协会的高速快运列车开行经验,从车站设施配置、线路设施、车型设计、运输组织、运输安
在阐述企业层面碳排放核算标准的基础上,界定物流企业碳排放源分为直接碳排放、间接碳排放和其他碳排放,对国外物流企业碳排放计算方法进行比较分析,研究物流企业移动源和固
虚拟室内漫游技术已成为房地产销售的重要手段,长期以来3DS室内效果图得到广泛应用,但基于3DS室内模型的虚拟室内漫游技术鲜有研究。以3DS MAX、VC++和OpenGL软件为平台,对基
随着Internet的发展,电子商务的广泛开展,电子商务公司之间的竞争变得日益尖锐。利益的驱动,法律的空缺,使众多电子商务主体采取非正当手段从事经营活动,不正当竞争行为大量
随着资源、能源危机的加剧,环境问题的日益突出,建设生态居住区无疑是我国住宅产业发展的必然要求和趋势。研究了世博生态城三期的生态建设情况,期望能给生态居住区的建设带
目的评价射频消融术治疗阵发性室上性心动过速的有效性及安全性。方法对210例阵发性室上速患者采用射频消融术治疗,旁路在心室最早激动点(EVA)或心房最早激动点(EAA)消融,双
对外开放在推动中国经济模式的转变中起到决定性作用,主要体现在:对外开放打破传统观念,指明改革方向,为转变中国经济模式扫清了思想上的障碍,推动了经济体制模式的转变;同时
对男男性接触者(MSM)与同性恋现象的定义,男男性接触现象在人群中的分布状况及其人数估计,MSM人群的主要活动场所及特点,该人群中与艾滋病病毒(HIV)传播有关的高危险行为特点
在传统CORDIC算法的基础上提出一种改进算法.通过在Matlab中搭建模型验证改进算法的正确性,该算法在不影响数据要求精度的条件下扩大了旋转角度范围,减小了所需的ROM存储空间
<正>习近平总书记在党的十九大报告中指出,必须坚持质量第一、效益优先,以供给侧结构性改革为主线,推动经济发展质量变革、效率变革、动力变革,提高全要素生产率。《中华人民