基于哈希学习的图像数据快速检索方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:dragonunderwater
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年手持网络终端的快速增长,社交网络的盛行,数据量呈现出爆炸式的增长。高维数据的存储和检索已成为利用这些数据的瓶颈因素,如何对这些数据进行高效的存储和检索引起了学术界和商用业广泛的关注。哈希方法是一种高效的索引方式,使用哈希码表示这些高维数据既能减少存储空间,又方便提高数据的检索速度得到了广泛的应用。传统哈希方法在数据检索上取得了一定的成果,但是其依赖于手工特征提取过程,对于大规模数据而言工作量巨大。近年来卷积神经网络在图像特征提取领域取得了显著的效果,研究人员将卷进神经网络和哈希方法结合在一起提出了全新的研究方向深度哈希学习,并在一定程度上取得良好的效果。如何进一步提升哈希码表示准确率有助于提高数据的检索精度,所以在该方面的研究有着重要的意义和价值。针对于如何生成较优的哈希码,提出了一种新的基于三元组深度哈希网络模型。模型总体结构分为两部分,分别是特征提取部分和哈希生成部分。在特征提取部分充分利用卷积神经网络在图像特征提取领域优良特性,总体框架使用AlexNet网络模型基础上进行改进,模型输入为三元组,三者之间具有三元约束关系,充分利用三元约束实际训练中分类效果好,对于模型的适应性也好的特点。模型使用三元损失函数同时正负方向训练模型,得到样本的最有表现力的特征。在哈希生成部分,使用对约束作为约束条件,从而使同类样本之间哈希码的汉明距离小于异类之间的距离,生成能够保留图像相似,得到样本图像较好的哈希码。在经过基于三元组深度哈希网络提取出哈希码之后,针对于传统使用汉明距离粒度较大和无法表示汉明距离和图像相似度之间的关系,设计出两种不同的优化算法,分别是基于近邻权值的加权汉明距离重排算法和基于量化哈希的检索重排算法。在基于近邻权值的加权汉明距离的重排算法中,将哈希码的每一位赋予其特定重要程度,使用似然函数的思想对于某一位哈希码分离度越大,其权值越大。基于量化哈希图像检索重排主要适用于深度哈希网络生成的哈希码,在进行松弛为哈希码之前特征会保留的更加完整,通过哈希码索引缩小检索范围,然后通过对比松弛前特征向量对比相似度重排输出。本文通过理论研究和相关实践,对基于哈希学习图像数据检索技术提出了一系列改进,使基于哈希码的图像检索有着更好的效果。
其他文献
本文基于B/S模式研究开发了网络环境下的企业综合管理系统,提出了网络综合管理系统的硬件配置方案,分析了系统功能,给出了软件总体框架,以VS.NET为开发平台,研究了软件系统设计与工
关于少数民族题材油画的创作和文学研究的内容已经屡见不鲜,但是本文只截取新疆地区少数民族的经典作品进行鉴赏、分析,此前有不少学者对于研究新疆少数民族题材创作方面的文
胰岛素样生长因子(IGF)系统是人体内的一组多肽类物质,其分泌细胞广泛分布在人体各组织中,具有促生长作用。IGF系统能够诱导肿瘤细胞出现EMT,进而增强肿瘤细胞干性、自我更新
针对聚合物改性透水混凝土配合比设计中缺乏聚灰比参数选取的理论依据,研究了聚灰比对聚合物改性透水混凝土浆体的裹附性、流动度以及透水混凝土的力学性能和透水性能的影响
随着科学技术的发展和工业生产的进步,疲劳问题越来越受到人们的关注。据统计,在实际生产中约有80%的构件失效是由材料疲劳引起的。目前,在结构安全性与可靠性评价中,一般以
假冒伪劣产品的生产和流通严重损害了国家、集体、消费者和厂家的利益;甚至危害公民的身体健康和人身、财产安全。产品可追溯性是产品管理制度的重要组成部分,在发达国家的政
目的:氨基糖苷类抗生素(AGs)是由微生物产生或经半合成制取的一类由氨基糖或中性糖与氨基环醇的苷键相结合易溶于水的碱性抗生素。其作用机制主要是抑制细菌蛋白质的合成,肌注
糖尿病分子发病机理的进展涉及了近百种基因的转录与翻译水平表达及其生物学作用的异常,尤其值得注意的是氧化侵袭作为糖尿病及其合并症发生发展的核心机制一直是近年来糖尿
自承式楼板在施工进度、质量、成本控制及现场安全文明施工等方面有着传统支架现浇楼板所不可比拟的优势,逐渐成为了当今高大建筑楼板施工的首选技术。本文就自承式楼板和传
培养学生的美术表现素养,是促进学生美术核心素养逐渐养成的重要途径,也是实施美育熏陶、践行课标精神的重要方面。在学生美术表现素养的培育方面,教师可以带领学生认识媒材,