无监督的域适应行人重识别算法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:dk_winner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域,行人重识别占有越来越重要的地位,因为它在刑侦、智能视频监控等方面应用的高效性,使得行人重识别具有很高的研究价值。给定一张行人图片,行人重识别旨在在不重叠的摄像头视域中查找指定行人的图片。近年来,尽管行人重识别的识别率已经有了较大的提升,但当行人重识别应用到多个数据集时,在一个数据集上训练的行人重识别的模型到了另一个数据集上往往表现较差。为了解决行人重识别中多个数据集之间的区域间隔问题,本文提出了基于CycleGAN的域适应行人重识别算法。在CycleGAN的基础上,为了解决在无监督的图像翻译过程中的行人身份标签丢失的问题,本文提出基于DTGAN的域适应行人重识别算法,在实验中证明了这种新型的结构能够很好地解决在不同数据集上行人重识别模型的适应性问题。本文的主要工作如下:(1)本文提出了一种基于CycleGAN的图像翻译基准方法来解决行人重识别中的区域适应问题。本文我们将该方法划分为两个步骤,第一步是以无监督学习的方式翻译源数据域上的图片,翻译后的图片同时保留目标数据域图片的风格特征和源数据域图片的身份信息;第二步是将翻译后的图片以有监督学习的方式进行模型训练,最后在目标数据域对模型进行测试。实验表明,该基准方法能较好地解决行人重识别数据集间的区域间隔问题,相较于直接迁移方法具有显著的准确率提升。(2)本文提出了一种全新的无监督学习的网络架构,命名为DTGAN(Double-domain Translation Generative Adversarial Network),用来提升基准方法。DTGAN 分为两部分,一部分是Siamese网络,另一部分是CycleGAN。CycleGAN在图像翻译的过程中学习源域和目标域之间的映射,通过身份保存机制,Siamese网络将具有相同身份信息的源数据集图片和翻译图片距离拉近,将具有不同身份信息的目标数据集图片和翻译图片距离拉远,从而在图像翻译的过程中,行人的身份信息得以保留。最终加入标签平滑正则化(LSR)的策略,来消除模型训练的过程中产生的噪声。实验表明,DTGAN能生成高质量的行人图片,并且很好地解决了行人重识别中区域间隔的问题。另外,DTGAN在Market1501和DukeMTMC-reID数据集上都取得了理想的效果。
其他文献
随着互联网以及多媒体技术的迅速发展,计算机需要处理的图像数据量正在快速增长,为了有效处理这些数量庞大的数据,产生了各种各样的图像数据库及相关处理算法。而图像检索是
随着共享经济的不断发展,我国共享出行行业兴起并发展壮大。从有桩公共自行车到共享单车、共享助力车,再到近年的共享汽车、网约车,共享出行行业的交通方式不断丰富。共享出行行业的壮大有利于智能交通的进一步发展,改善城市交通状况;也有利于提高资源的利用效率,培养人们绿色出行的理念。但是,由于共享出行行业中不同交通方式有其各自的特点,且该行业目前市场环境复杂、存在诸多不稳定因素,共享出行企业面临着巨大的财务风
背景:随着信息技术及信息产业的迅猛发展,人们的信息利用与信息检索需求不断提高,在当今以网络化、信息化为特征的时代,信息检索能力的高低影响着个人的社会竞争力,较强的信
图像分类与目标跟踪一直是计算机视觉领域中的核心问题。近些年来卷积神经网络(CNN)与TLD算法分别在这两个领域取得了瞩目的成果。与此同时,随着手机等移动设备的计算性能不
民族精神是一个民族的心理特征、文化传统、思想情感等综合反映。中华民族精神不仅是中华民族赖以生存发展的精神支柱,也是推动中国特色社会主义社会乃至整个人类社会发展的强
随着计算机技术的发展和国家的需要,超大跨度桥梁混合梁斜拉桥也发展迅速,越来越多的宽幅箱梁在混合梁斜拉桥被应用,但是由于宽幅箱梁整体宽度较大,并且超大跨度桥梁在世界上存量较少,更别说是混合梁斜拉桥,相对应的湿接缝相关研究还不是很多。因此,本文以实际工程为背景,对宽幅箱梁的湿接缝早起裂缝形成的原因进行分析研究。探究各种不同参数对宽幅箱梁湿接缝的早期裂缝的影响,并提出相应的裂缝预防和处理措施,为今后的同
随着云计算的快速发展,在开放环境下共享与处理数据显得尤为重要,数据所有者在上传数据时不仅要制订灵活的访问控制方案,而且还要保证与用户之间通信过程中的数据的机密性。
随着居民收入的增长和医疗技术的进步,医疗费用急剧上涨,医疗质量却没有因此得到大幅提升,过度医疗情况广泛存在。规范化诊疗流程的临床路径应运而生。但是纸质临床路径包含