论文部分内容阅读
随着近些年手持网络终端的快速增长,社交网络的盛行,数据量呈现出爆炸式的增长。高维数据的存储和检索已成为利用这些数据的瓶颈因素,如何对这些数据进行高效的存储和检索引起了学术界和商用业广泛的关注。哈希方法是一种高效的索引方式,使用哈希码表示这些高维数据既能减少存储空间,又方便提高数据的检索速度得到了广泛的应用。传统哈希方法在数据检索上取得了一定的成果,但是其依赖于手工特征提取过程,对于大规模数据而言工作量巨大。近年来卷积神经网络在图像特征提取领域取得了显著的效果,研究人员将卷进神经网络和哈希方法结合在一起提出了全新的研究方向深度哈希学习,并在一定程度上取得良好的效果。如何进一步提升哈希码表示准确率有助于提高数据的检索精度,所以在该方面的研究有着重要的意义和价值。针对于如何生成较优的哈希码,提出了一种新的基于三元组深度哈希网络模型。模型总体结构分为两部分,分别是特征提取部分和哈希生成部分。在特征提取部分充分利用卷积神经网络在图像特征提取领域优良特性,总体框架使用AlexNet网络模型基础上进行改进,模型输入为三元组,三者之间具有三元约束关系,充分利用三元约束实际训练中分类效果好,对于模型的适应性也好的特点。模型使用三元损失函数同时正负方向训练模型,得到样本的最有表现力的特征。在哈希生成部分,使用对约束作为约束条件,从而使同类样本之间哈希码的汉明距离小于异类之间的距离,生成能够保留图像相似,得到样本图像较好的哈希码。在经过基于三元组深度哈希网络提取出哈希码之后,针对于传统使用汉明距离粒度较大和无法表示汉明距离和图像相似度之间的关系,设计出两种不同的优化算法,分别是基于近邻权值的加权汉明距离重排算法和基于量化哈希的检索重排算法。在基于近邻权值的加权汉明距离的重排算法中,将哈希码的每一位赋予其特定重要程度,使用似然函数的思想对于某一位哈希码分离度越大,其权值越大。基于量化哈希图像检索重排主要适用于深度哈希网络生成的哈希码,在进行松弛为哈希码之前特征会保留的更加完整,通过哈希码索引缩小检索范围,然后通过对比松弛前特征向量对比相似度重排输出。本文通过理论研究和相关实践,对基于哈希学习图像数据检索技术提出了一系列改进,使基于哈希码的图像检索有着更好的效果。