论文部分内容阅读
在计算机视觉领域,行人重识别占有越来越重要的地位,因为它在刑侦、智能视频监控等方面应用的高效性,使得行人重识别具有很高的研究价值。给定一张行人图片,行人重识别旨在在不重叠的摄像头视域中查找指定行人的图片。近年来,尽管行人重识别的识别率已经有了较大的提升,但当行人重识别应用到多个数据集时,在一个数据集上训练的行人重识别的模型到了另一个数据集上往往表现较差。为了解决行人重识别中多个数据集之间的区域间隔问题,本文提出了基于CycleGAN的域适应行人重识别算法。在CycleGAN的基础上,为了解决在无监督的图像翻译过程中的行人身份标签丢失的问题,本文提出基于DTGAN的域适应行人重识别算法,在实验中证明了这种新型的结构能够很好地解决在不同数据集上行人重识别模型的适应性问题。本文的主要工作如下:(1)本文提出了一种基于CycleGAN的图像翻译基准方法来解决行人重识别中的区域适应问题。本文我们将该方法划分为两个步骤,第一步是以无监督学习的方式翻译源数据域上的图片,翻译后的图片同时保留目标数据域图片的风格特征和源数据域图片的身份信息;第二步是将翻译后的图片以有监督学习的方式进行模型训练,最后在目标数据域对模型进行测试。实验表明,该基准方法能较好地解决行人重识别数据集间的区域间隔问题,相较于直接迁移方法具有显著的准确率提升。(2)本文提出了一种全新的无监督学习的网络架构,命名为DTGAN(Double-domain Translation Generative Adversarial Network),用来提升基准方法。DTGAN 分为两部分,一部分是Siamese网络,另一部分是CycleGAN。CycleGAN在图像翻译的过程中学习源域和目标域之间的映射,通过身份保存机制,Siamese网络将具有相同身份信息的源数据集图片和翻译图片距离拉近,将具有不同身份信息的目标数据集图片和翻译图片距离拉远,从而在图像翻译的过程中,行人的身份信息得以保留。最终加入标签平滑正则化(LSR)的策略,来消除模型训练的过程中产生的噪声。实验表明,DTGAN能生成高质量的行人图片,并且很好地解决了行人重识别中区域间隔的问题。另外,DTGAN在Market1501和DukeMTMC-reID数据集上都取得了理想的效果。