论文部分内容阅读
随着智能设备的日益普及,图像的种类和数量呈现爆炸式增长,对图像的有效检索成为了热门话题。有效的索引机制是实现大规模图像检索的一个重要前提,而传统的图像索引算法一般适用于少量且低维的场景中,不能处理海量数据。因此,针对海量、高维图像数据,建立有效的索引并实现准确、快速的检索任务已成为计算机视觉中的研究热点。基于哈希的索引算法具有查询速度快,存储占用小的优点,近些年受到了广泛的关注。在这一背景下,本文的主要工作是研究哈希算法及其在大规模图像索引中的应用,主要包括:(1)提出了各向同性的迭代量化哈希算法。迭代量化哈希(Iterative Quantization,ITQ)对旋转矩阵施加的约束过于单薄,容易导致过拟合;各向同性哈希(IsoHash)缺乏对哈希编码的更新策略,无法保证编码质量最优。针对上述问题,本文采用迭代的策略,对编码矩阵和旋转矩阵交替更新,并在正交约束的基础上增加各向同性约束来学习最优旋转矩阵,使得投影具有更小的量化误差。实验中与主流算法进行了对比,结果表明,该算法具有更好的查全率、查准率。(2)提出了逆谱哈希。谱哈希(Spectral Hash, SH)目标函数的优化不能保证在原始高维空间中近邻的样本点投影到低维编码空间中依然近邻,在各种检索评价指标中要落后于主流哈希算法。本文在SH的基础上将输入与输出位置交换,将相似性定义从根据原始高维数据转变成根据低维的哈希编码,采用人工神经网络模拟哈希函数进行求解。实验结果表明,该算法保证了相邻样本投影后海明距离小,不相邻样本投影后海明距离大,取得较好的检索性能。(3)设计了基于哈希索引的网页服装检索系统。用户上传图片,服务器后台进行提取特征、哈希编码、重排等一系列操作,然后按照用户需求返回检索结果。经过大量的测试,该系统满足了基本检索需求,效果较好。