论文部分内容阅读
行人再识别是指在具有不重叠视域的监控摄像机网络中对拍摄到的行人图像进行身份关联的工作。在跨摄像机跟踪、多视角行为分析、行人搜索等诸多应用中,行人再识别起着至关重要的作用。由于监控视频通常质量较低且环境不可控,使得人脸、指纹与步态等生物特征不可靠或无法获得,行人再识别只能依赖于衣着表观信息来匹配不同监控画面中行人的身份。受到光照、拍摄视角、行人姿态变化等因素的影响,同一行人在不同摄像机下的表观会存在显著的差异,因此行人再识别是一项非常具有挑战性的任务。在对行人再识别问题的研究中,基于度量学习的方法由于能够取得更高的匹配性能现已成为当前的研究热点。本文从度量学习的角度出发,对行人再识别中存在的训练样本不平衡、训练数据中不同类型判别信息未能同时利用与小样本数据等问题进行了深入的研究,主要工作与贡献如下:(1)针对行人再识别数据集中正、负样本对严重不平衡的问题,提出了大间隔相对距离度量学习算法(Large Margin Relative Distance metric Learning,LMRDL)。在LMRDL中,提出了具有更强约束力的三元相对距离损失函数,能够有效避免不平衡样本引起的度量偏差。为了保证能够取得全局最优解,设计了logistic度量学习模型,并采用加速邻近点梯度(Accelerated Proximal Gradient,APG)方法优化求解。在多个不平衡数据集上的实验结果表明,和使用二元距离约束学习度量的方法相比,LMRDL能够有效地提升行人再识别的性能。(2)针对当前度量学习方法未能同时利用训练样本间距离和夹角内积两种类型判别信息的问题,提出了一种广义相似性度量学习(Generalized Similarity Metric Learning,GSML)模型。该模型将马氏距离与双线性相似度结合起来联合学习广义的相似性,实现两种度量的优势互补。在多个行人再识别数据集上的实验结果表明,GSML能够获得比学习单一的距离度量或内积相似性度量更优的性能。与LMRDL方法相比,也具有一定的性能提升。(3)针对距离度量学习中的小样本问题,提出了核化边界零空间学习(Kernel Marginal Nullspace Learning,KMNL)算法。为了避免小样本情况下由于特征表达向量维度远高于样本数导致的类内散布矩阵奇异的问题,提出了学习类内散布矩阵零空间的行人再识别方法。在将样本投影到此零空间后,同类样本将塌陷为一个点。因此,在不同类别样本间的距离为非零时,即可实现最优的行人图像匹配。在该方法中,首先推导了线性投影时的学习方法,并进一步扩展到采用核方法实现非线性映射的场景。实验结果表明,KMNL算法不仅能够有效地处理行人再识别度量学习中的小样本问题,而且训量耗时低、再识别性能优异。(4)为了模拟人工行人再识别中的多专家决策与在线训练样本扩充,在KMNL基础上进一步提出了迭代学习多个核化度量(Iterative Multiple Kernel Metric Learning,IMKML)的行人再识别方法。该方法不仅能够利用训练集中的样本学习多个核化度量,还可以利用正确识别的测试集样本来增强度量的判别力。具体来说,IMKML中包含了两个主要的模块。其中一个模块是使用KMNL作为基础模型学习多个核化零空间度量;另一个模块是在测试集上完成行人再识别后,挑选出最有可能被正确匹配的图像加入到训练集中重新学习核化零空间。通过交替迭代这两个模块,能够使更多的正确匹配测试样本不断加入到训练集,从而增强度量的判别性并提升初始的行人再识别准确率。本文对基于度量学习的行人再识别中存在的问题提出了相应的解决方案与算法模型,并通过大量的实验验证了这些算法的有效性。本文的研究成果将会进一步推动行人再识别技术在视频监控中的应用。