论文部分内容阅读
随着互联网技术的发展和社交媒体的广泛普及,社会诸多领域的信息和数据源得到了丰富和扩展,例如数字图书馆、安防影像、遥感系统、医疗影像等。在信息化时代,数据已经成为当今社会发展不可或缺的资源,面对如今数据呈现大规模爆发式增长的趋势,如何运用好现代信息技术来处理如此庞大的数据已经成为一项重要且具有挑战性的课题。基于哈希的图像检索方法因其检索占用内存空间小、速度快、准确率高等特点成为国内外广大研究者的研究热点。基于哈希的图像检索方法旨在将具有高维特征、高存储量的图像数据通过哈希码形式来表示,这既降低了存储空间又提高了的图像检索的效率。在已有的哈希学习技术中,基于监督学习的哈希学习技术因其利用监督信息来进行哈希学习,往往实现了更高的检索精度,如监督离散哈希(SDH)、快速监督离散哈希(FSDH)等。SDH技术在目标函数中将哈希码回归到其相应的标签,而FSDH技术则将每个标签回归至其相应的哈希码空间。然而,在许多现实应用中,大量数据通常会分布在多台机器上,如安防数据、通信网络数据等。因此,为克服集中式哈希只能处理单台机器上的数据的局限性,监督分布式哈希(SupDisH)被提出,SupDisH将SDH技术拓展到分布式框架中学习,取得了不错效果。本文结合FSDH技术,提出了分布式快速监督离散哈希算法(DFSDH)。具体地说,FSDH被引入到分布式框架中,在该框架中,所有节点共享集中式哈希学习模型。同时,在分布式网络中的节点上引入一致性约束以保证所有节点通过共享参数的方式并行进行哈希学习。对于单一节点,通过采用交替迭代过程来获取高质量的二进制哈希码和哈希函数。在复杂度对比上,DFSDH算法和SupDisH算法的通信复杂度保持了一致,但是前者的计算复杂度要远高于后者。最后,在两个公开数据集CIFAR-10和MNIST上的实验结果表明DFSDH与大多数集中式监督哈希方法和现有分布式哈希方法相比检索精度总体略有提升。而在训练效率对比上,DFSDH算法的训练效率极大的高于SupDisH算法的训练效率,这也成功的验证了DFSDH算法较低的计算复杂度。总的来说,本文提出的DFSDH算法与大多数集中式监督哈希方法和现有分布式哈希方法相比具有较好的竞争力。