论文部分内容阅读
在视频监控系统中,行人重识别是一个非常重要的任务。行人重识别的目标是建立不同时间不同摄像头下监控画面中行人图片的联系,识别特定行人在不同摄像头下是否出现,可以获取特定行人的活动轨迹,具有很强的实际意义。实际应用中,由于摄像头拍摄角度场景不同、光照变化及行人姿态改变等因素,同一行人在不同摄像头下的差距较大,使行人重识别成为视频监控领域中一个极具挑战性的难题。传统方法中,行人重识别被分为基于人工设计的特征提取方法和通过学习行人相似度获得距离函数的度量学习方法。近年来,在计算机领域中,卷积神经网络在学习特征方面的优势得到了充分的展现,在诸如图像分类、目标检测等任务中都体现出了优越的性能。本文主要研究基于卷积神经网络的行人重识别方法,主要内容如下:(1)提出了一种基于Siamese卷积神经网络的行人重识别方法。针对传统方法中难以提取行人中具有判别性特征问题,采用流行的卷积神经网络为行人样本提取更有判别力的特征。在经典的卷积神经网络AlexNet的基础上,结合Inception-2和Inception-3的优点,本章提出了一种适用于行人特征提取的卷积神经网络,最终获得的行人特征用来进行行人重识别。针对行人数据集中样本过少的问题,采用Siamese网络结构通过增加负样本的数量来提高总体样本数量,来解决网络训练过程中行人训练样本过少而导致的过拟合问题。Siamese网络结构的输入是行人样本对,通过训练学习一个相似度模型,使得相同行人之间的相似度接近,不同行人的相似度变大。(2)提出了一种基于DGD(Domain Guide Dropout)卷积神经网络的行人重识别方法。在行人重识别领域中,单一行人数据集的规模往往较小,数据采集来自相似的场景,具有相同的底层分布。采用卷积神经网络在单一行人数据集下进行训练,训练获得的模型需要考虑如何避免过拟合而且不具有普适性,实际应用价值一般。DGD卷积神经网络通过混合多个数据集并重新分配标签获得了多域数据集,采用多域数据集来训练可以防止卷积神经网络因样本数量过少而导致的过拟合,学习的模型可以在多个场景进行行人重识别,更具有实际应用价值。在利用DGD卷积神经网络提取到256维的特征后,本章提出了样本特征相对距离,通过计算各个样本特征之间的相对距离,在256维特征中筛选对类内类间距离更具有判别力的特征,以此来提升行人重识别算法效果。本章在256维的特征中,分别选取了128和192维对类内类间距离更具有判别力的特征进行了实验。本文提出的算法在公开图像数据集CUHK03和iLIDS进行实验,证明本文算法具有良好的效果。