优化的K均值哈希量化用于近似最近邻检索

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:a341104361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,互联网每时每刻都在产生大量的数据,这些数据资源包括文本、图像、音频、视频等等。面对这些海量高维的数据,如何快速准确的检索到目标数据是目前计算机领域普遍关注的一个重要问题,这就需要人们对这些数据进行有效地存储及索引,并且能够进行高效地查询。近似最近邻检索成为了解决该问题的有效手段,并逐渐应用到各个领域中。高维数据的近似最近邻检索技术主要分为两类,一类是基于模型的方法,如乘积量化(PQ)、加法量化(AQ)、堆叠量化(SQ)等;另一类是基于投影哈希的方法,如局部敏感哈希(LSH)、迭代哈希(ITQ)等。基于模型的方法和基于投影哈希的方法发展都很快,在不同的应用场景下都有各自的优点。在相同的编码长度下,基于模型的方法通常相对于投影哈希方法更加精确,然而距离计算方面要比投影哈希的方法慢。近几年,基于模型的二值哈希成为一个研究热点,比如K均值哈希(KMH)、自适应编码哈希(ABQ)等。该类方法由于引入了模型的思想,所以表示精度较高;同时近邻查找又基于汉明距离计算及排序,所以效率很高,对于高维数据的处理更具优势。不过该类方法受限于二进制表示超立方体的特性,量化结果不能够很好地符合真实数据的分布结构,产生了较大的量化误差。本文深入研究了二值哈希中的典型方法:K均值哈希(KMH)。针对KMH存在总体量化误差较大的不足,提出了一种优化的K均值哈希量化(OKMH)模型及其求解算法,OKMH可以寻找一个更优的子空间划分策略,在减小聚类误差的同时,降低了二值表示引起的距离保持误差。进一步,提出了一种细化的K均值哈希量化(ROKMH)方法,在上述优化模型中加入自适应编码的技术,得到更精炼的二进制编码子集及码本,从而进一步降低了 OKMH的总体误差,提高了近邻算法的检索性能。最后,在四个公开的数据集SIFT、CIFAR-320、CIFAR-512和CALTECH256上,本文对所提出算法的有效性和性能进行验证。通过对量化误差、召回率、精确率以及MAP值等指标的评估及分析,说明了本文方法的有效性。并与主流的哈希方法如LSH、KMH、ABQ等进行检索性能的对比,实验显示,本文提出的方法具备较明显的优势,多数情况下,对于检索结果的相对MAP值提高了 10%左右。
其他文献
党的十九大报告确定了新时代优先发展教育事业、加快教育现代化、建设教育强国的战略部署。通过一流大学和一流学科建设引领,将“高等教育内涵式发展”的任务,从倡导性的“推动
人到中年,常常回忆过去走过的路,在我做教师的二十多年里,有十几年担任毕业班工作,在教育教学中也取得了一些成果。往年暑假过后,接教的班级比较顺手,无论课上还是课下学生都十分配
福建师范大学西方经济学博士点整合了福建师范大学经济学院和公共管理学院等相关学院的教学与科研力量,形成了一支具有比较坚实的理论基础、复合型的知识结构、学术梯队结构合
项目管理在建筑工程建设期间发挥着重要作用,在项目管理期间,为了更好的解决施工质量问题,首要做的就是对施工质量进行合理的控制,在施工质量控制中,应遵照相应的控制原则与
本文从理论上分析了国际资本与发展中国家的经济增长二者之间的辩证关系,回答了发展中国家利用外资发展经济的成功战略的动因和路径。本文认为,一个国家要想成功地利用外资加速
当前社会背景下,政府部门采购工作开展阶段,招标方式属于目前普遍应用的采购方式。在具体招投标工作开展中,评标属于核心环节,是采购招标关键点。但就实际情况而言,部分政府
卡丁车-登陆中国大陆,各种媒体便纷纷炒作,闲暇时开开卡丁车已然成了都市人的别样乐趣。因工作的需要,多次采访京城的汽车俱乐部,每每听到卡丁车运动,便萌发了报道卡丁车运动
教学评价在教学中起着导向与监控的重要作用,它为教学指明了方向。然而,当前学校教学评价存在过分强调甄别功能,而忽视了激励功能;过分看重结果,而不关注学生的学习过程;过分关注学
高桥和子(1932年3月2日-2003年7月12日)出生于京都,是活跃于昭和·平成时代的日本女性作家。因作品《被囚》《远方的水声》《被丢失的画》接连获得芥川奖提名引起学界的关注。她曾先后获得过田村俊子赏、泉镜花赏、川端康成赏、女流文学赏等众多权威奖项。高桥的作品以日常生活为出发点,深刻地揭露了潜藏于女性内心的恶意。其笔下女性人物的异常行为反映了现实社会中女性面临的各种问题。截至目前,无论国内外,针
张爱玲小说的时空营造与中外文化之关系,是一个值得人们瞻视的研究课题.本文从独特的时空意识、故事时空的内部机制、叙事时空的文本形态及新的审美图式等层面,探讨张爱玲如