论文部分内容阅读
随着互联网技术的普及与发展,每天可以产生数以万计的图像信息。如果使用人工的方法来识别和分类如此大规模的数据,必然会消耗巨大的人力和财力,带来不必要的资源浪费。因此,人们通过利用计算机高效的计算性能来帮助人类对图像进行识别和分类从而达到节约成本的目的。然而,由于数据规模过于庞大,对于一般的分类算法而言很难在短时间内完成目标任务的分类,于是有人提出通过使用异或操作代替一般的加减乘除操作来提升运算速度,该技术被称为哈希。近期的图像识别的研究显示学习紧密的哈希码可以显著地提高处理大规模数据的速度和减少存储和计算的消耗。许多基于手工特征的哈希方法被提出,这些方法在不损失过多的精度的前提下,显著地提升了图像检索的速度。近些年,随着深度学习技术的发展,人们发现基于神经网络的深度特征比传统方法的特征有着更好的效果。因此学习深度哈希函数可以大大地提升检索性能,尤其是在使用语义监督信息的基础上。相反地,当前的无监督深度学习算法却很难满足性能需求,主要是因为缺少相似性敏感的目标方程或合适的松弛优化的方法。行人重识别是图像识别的一个子类,是利用计算机视觉技术方法来判断行人图像或者行人视频序列中是否存在特定要查找的行人的一种技术。给定一个监控行人图像,检索跨设备下的该行人图像,旨在弥补目前固定的摄像头的视觉局限,并可与行人检测,行人跟踪技术相结合,可广泛应用于智能视频监控、智能安防等领域。由于不同摄像设备之间的差异(例如角度、分辨率、明暗度等),同时行人又易受到穿着、遮挡、姿态和视角等影响,使得不同角度的摄像设备拍摄的行人差异性大,一般的机器学习系统很难辨别,这使得行人重识别任务成为计算机视觉领域中一个非常具有研究价值和挑战性的热门课题。然而,由于一般的行人重识别技术过多的依赖于语义标签,并且由于现在大部分的先进的行人重识别算法都是基于卷积神经网络的。但是通常的神经网络由于层数较深,浮点计算过多并且最后输出的特征长度过长,这些情况导致了现在的行人重识别算法的速度都比较慢,并且由于神经网络比较依赖于语义标签,然而现实中被标签的数据往往都是少量的。因此如何在脱离标签的前提条件下快速地进行识别已经成为了一个比较流行的问题。一个典型的方法是结合基于哈希的图像检索的速度快的优势来完成行人重识别任务,这样可以大幅度的减少检索和识别任务的时间复杂度和空间复杂度,从而实现实时的监测任务。在这篇文章中,我提出了一个简单但有效的无监督哈希的框架来交替的执行三个训练模块:深度哈希训练,相似图模型更新和二值码优化。该方法与广泛使用的两步哈希方法的显著区别在于学习到的深度模型输出表征可以帮助更新相似图矩阵来提升随后的二值码优化效果。另外,为了产生高质量的二值码,我设计了一个有效的离散优化算法,用一个常用的哈希损失函数来直接地处理二值约束。文中大量的相关实验也可以显示出我的算法明显优于目前最好的方法,从而验证了提出方法的有效性。