论文部分内容阅读
随着互联网的迅速发展,如今网络每日新增的图片数据以亿为单位计量。然而在如此之多的图片中,如何在其中找到对自己有价值的图片是极为关键的。在图像检索领域,基于哈希学习的图像检索和基于量化的图像检索算法都可将图片的特征转化为低维的二进制码,但哈希存在压缩之后直接根据二进制码检索会导致信息损失过大、精度不高、对图像特征分布的依赖大等问题,而基于量化学习的图像检索能较好的克服这些问题,这无疑是方向上的一个巨大提升。基于量化的图像检索算法因其比哈希更高的信息保存度和更高的准确度,但又具有哈希所不具有的通过二进制码对原始图像进行还原的优点,基于量化的图像检索方法越来越多的被研究和应用。早期的图像检索一般都是有监督的,即需要用户来对图片的数据进行信息的标注,需要一段额外的补充文字进行描述,虽然这样做所取得的效果很好,但这是非常耗费人的时间精力和物力成本的。结合现在图片数据的增加速度来看,这显然是让人无法接受的,工业界和学术界更青睐无监督的图像检索算法。为了解决以上几个不足,我们在本文提出了以下三个量化学习图像检索算法:(1)首先就检索数据库的压缩方面提出了一种基于k-means算法的粗量化筛选算法,用于在预处理阶段对数据库进行聚类处理,在检索阶段我们根据query选定聚类形成新的更小的检索范围,实验结果表明我们的算法能大幅度缩小检索计算量从而提高检索的速度。(2)接着本文提出了一种新的无监督的高召回率的MCQ量化学习算法。我们在局部迭代搜索求解二进制码的过程中加入候选者辅助筛选更优的解结构,在求解码本的过程中使用minibatch梯度下降方法提高下降过程中的稳定性,同时提出了引入drop方法防止码本数增多可能会导致的过拟合情况,实验结果表明我们提出的算法超过了其他的无监督量化学习图像检索方法。(3)最后我们提出了一种基于层次量化的MCQ算法,该算法基于码本的层次结构对码本更新和编码阶段进行了重新设计,使得码本仍然可以在无正交约束的情况下进行低计算时间复杂度的更新以及更低消耗的编码。