基于哈希编码的大规模图像检索算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ken331
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模图像检索任务是计算机视觉领域的重要研究分支,为了保证检索质量和计算效率,哈希检索方法已引起越来越多的关注。哈希检索方法的思想是将高维数据转换为紧凑的二进制哈希码,并为相似的数据项生成相似的二进制哈希码。目前,凭借强大的图像特征学习和哈希学习能力,深度学习结合哈希编码的深度哈希方法在实际检索任务中取得突出的效果。为了研究更为有效的哈希码以提升检索性能,本文在现有哈希方法基础上完成下面的工作。(1)提出一种基于哈希中心的连续学习方法,通过减少量化损失以提升检索性能。该方法在中心相似性的基础上,采用连续学习的方式优化带有符号函数激活的深层网络,解决不适定的梯度问题降低数据的特征损失。通过在NUS_WIDE、MS COCO和CIFAR-10三个基准数据集上的大量对比实验表明,基于哈希中心的连续学习方法可以显著提升检索性能,与当前经典的图像检索方法相比,所提出的方法可以得到更高的检索准确率。(2)提出一种基于HashNet的重排序方法,通过对汉明距离哈希位加权,并在检索阶段利用松弛前特征的欧氏距离进行细粒度重排序,以提升检索性能。在大规模检索任务中,通过HashNet减少了量化损失,使用哈希位加权汉明距离进行相似性度量可以对具有相同汉明距离的图像进行有效排序。另外,对粗检索得到的候选集再使用松弛前特征向量的欧氏距离进行细粒度重排序,可以进一步提升检索性能。通过在NUS_WIDE、MS COCO和Image Net三个基准数据集上的大量实验表明,基于HashNet的重排序方法能有效提高准确率并具有更好的鲁棒性。
其他文献
我国的工程教育认证工作于2006年正式启动,成为加强国际教育互认,推动工程教育改革和提高工程教育质量的重要驱动。2016年我国成为《华盛顿协议》正式成员,进一步提高了我国工程教育认证工作在国际上的影响力。随着我国工程教育认证工作的持续向好发展,认证覆盖的高校专业规模逐渐扩大,参与认证的高校专业数量不断提高,对于工程教育认证工作的方法创新和技术应用逐渐成为研究热点。课程管理作为高等教育人才培养的核心
随着法院信息化改革的不断深入,无纸化、信息化、规范化以及制度化在法院工作的各个层面不断的被提及,法院内部使用的各类业务系统同时也在改版和升级,如何整合现有的案件信
本翻译实践报告是基于美国古典学者格雷戈里A.斯塔利的《塞涅卡与悲剧的观念》(序言和第一章)的翻译实践而撰写的。该书从塞涅卡的悲剧入手,探究潜藏于其悲剧作品背后的创作动机的和诗学理论。原文属文论文本,涉及各种文学和文化元素,如西方诗学理论的概念和术语、相关古典悲剧作品选段以及希腊罗马神话中的神名、典故等。这些都包含了语言、风格上的“异质性”。译者选择贝尔曼(Berman)的“否定分析”理论来指导和检
习近平主席曾说过:“守住了青山绿水就是守住了金山银山。”保护自然,进行环境友好型经济建设已是我国经济发展的重要任务。如欲保护自然,了解自然是第一步,而市面上的科普书籍提供了不可或缺的知识。本文是一篇翻译实践报告,主要总结在科普书籍Complete Guide to Camping and Wilderness Survival的翻译过程中表现出的翻译难点和相应的解决策略。本报告分为四个部分,项目介
近年来,随着女性大规模进入劳动力市场,职业女性群体开始受到关注,特别是在事业单位工作的基层女职工,其职工队伍的工作能力同时影响着个人职业成长和公共服务质量。在知识经济时代里,组织学习导向对职工的职业生涯发展起着重要作用。以广西南宁市事业单位基层女性职工为例,采用“学习导向与女性职业成功量表”研究工具,通过线上线下问卷发放收集数据,运用SPSS 22.0对数据进行描述性分析、差异性分析、相关性分析、
均衡器作为音频处理器中重要的硬件单元,对声音信号的美化修饰起着至关重要的作用。二十世纪随着数字化音频技术的快速发展,原本模拟音频设备的性能得到大大改善,均衡器也逐步转化成了数字设备,对声音信号的处理也逐步转化成了数字信号处理。本文的研究目的,旨在设计一款面向ASIC的数字音频均衡器,以提高硬件单元的资源利用率。工作内容则是完成了ASIC前端设计中模块HDL建模、功能验证以及综合的环节。设计过程采用
傅里叶变换轮廓术(Fourier Transform Profilometry,FTP)作为一种快速的光学无损检测方法已经广泛应用于工业测量中,但目前其测量精度受环境影响比较大,主要原因是复杂的背景光会使条纹频谱中零频和基频产生混叠,不利于基频信息的提取,虽然传统的带通滤波方法能够提取出基频信息,但其提取精度受到窗口形状及窗口大小的制约,且做不到自适应性。为了提高测量精度,适应更复杂的测量环境,本
随着科技的蓬勃发展,各类建筑外墙喷涂机器人不断出现,这种新兴的技术不仅大幅度降低了行业成本,更是将人力从艰苦、繁重、高危的工作中解放出来。为了进一步实现喷涂作业的自动化,本文设计了一种视觉智能辅助指导系统,为建筑外墙喷涂机器人装上“眼睛”,引入视觉度量技术对目标喷涂区域进行窗口尺寸测量。度量系统将光学测试技术、计算机视觉和深度学习进行结合,由多源传感器获取待喷涂区域的色彩信息和深度信息并进行融合处
漆酶(EC 1.10.3.2)是一种含铜的多酚氧化酶。它对芳香族化合物、甾体激素和生物色素等具有广泛的催化特异性。统计发现,它可以催化氧化大约三百余种不同类型的底物,在家具装饰、低污染纺织、纸张脱色、生活洗涤和食品饮料等一系列行业中都具有巨大的应用潜力。近年来,对漆酶的研究日益受到重视。漆酶的来源非常广泛,大致可分为植物漆酶、昆虫漆酶、真菌漆酶和细菌漆酶。其中,细菌漆酶相对于其他漆酶,具有来源广、
目的:大量流行病学和动物实验表明,产前应激(PS)可能会导致子代的学习和记忆能力受损。然而,其潜在机制尚未被完全阐明。催乳素(PRL)被认为是一种应激激素,参与机体的应激反