【摘 要】
:
行人再辨识是计算机视觉领域的重要研究方向,属于图像检索的一个分支。主要任务是利用视觉算法(深度学习的方法)对几个不重叠无交叉设备下提取到的行人图像或视频进行配对,即当给定一个行人图像,在跨区域的视频监控系统中检索该行人图像。这一方向可广泛应用于视频监控、刑探侦查、智能安防等不同的社会领域。按方法类型的不同可将行人再辨识方法分为两类:基于非深度学习的行人再辨识和基于深度学习的行人再辨识。随着深度卷积
论文部分内容阅读
行人再辨识是计算机视觉领域的重要研究方向,属于图像检索的一个分支。主要任务是利用视觉算法(深度学习的方法)对几个不重叠无交叉设备下提取到的行人图像或视频进行配对,即当给定一个行人图像,在跨区域的视频监控系统中检索该行人图像。这一方向可广泛应用于视频监控、刑探侦查、智能安防等不同的社会领域。按方法类型的不同可将行人再辨识方法分为两类:基于非深度学习的行人再辨识和基于深度学习的行人再辨识。随着深度卷积神经网络的快速发展,基于跨模态、注意力机制、姿态估计、超分辨率和无监督的行人再辨识方法研究得到了蓬勃发展。然而,行人再辨识依然面临诸多挑战,例如,大规模数据的有效训练、行人外貌变化下的鲁棒性、无限制场景(遮挡、光照等变化)下的应用。为了解决以上问题,本文提出了批次分块遮挡网络和嵌入对齐模块的批次分块遮挡网络。1)批次分块遮挡网络由全局特征分支和特征删除分支组成,并以Res Net-50作为主干网络。其中全局分支用于对全局特征进行学习和编码,由第一分支和第二分支组成的批次分块遮挡分支是一个具有特征遮挡功能的双分支结构,对局部细节特征进行学习和编码。给定一个批次输入图像经主干网络计算得到的特征向量为T。第一分支中的批量擦除层会随机擦除张量中的同一区域,将擦除区域内所有位置的值都归为0。第二分支则会先将输入的特征图均分成上下两块,然后在每一块中随机地遮挡一小块,即将遮挡区域内的所有值设为0。设在特征图上应用第一分支和第二分支的擦除处理后得到的特征张量分别为T?和T?。此目的是学习多个关注的特征区域,而不是只关注主要的识别区域。增加了网络训练集的多样性,在多个数据集上检测效果都有明显提高。2)行人对齐网络是在批次分块遮挡网络的基础上对全局分支加了两个模块,分别是:映射估计网络和对齐分支。用映射估计分支来实现空间变换,将Res Net第四个卷积模块输出的大小为14*14*1024的特征图作为输入,输入映射估计网络进行卷积变换,输出为6维的向量?用于生成图像网格,解决背景过多和部分缺失的问题。对齐分支结构与主干网络类似,包含Res Net的第三卷基层和第四卷基层。对输入图像Xi,我们从原始图像和对齐后的图像中获得行人特征。行人更好的对齐可以学习到更多的判别特征,提高了行人匹配的准确性。将Duke数据集上的rank-1精度提高了1%-2%,达到了87.1%。将Market-1501数据集上的m AP精度提高了2%-3%,达到了86.4%。通过对多个大规模数据集的测试,结果表明本文提出的批次分块遮挡网络具有良好的鲁棒性,提高了行人检测的准确性。基于分块遮挡的行人对齐网络在具有较强提取局部特征能力的条件下,解决了输入行人图像的背景过多和部分缺失问题,使输入行人图像达到语义对齐,增强了提取全局信息的能力。这两种方法的提出在行人再辨识方向取得了较好的效果。
其他文献
在互联网以及信息技术飞速发展的今天,物联网(Internet of Things,IoT)的研究得到了广泛的关注和重视,我国已经将物联网列入了国家的五大新兴战略性产业之一.物联网按照特定的网络协议将物体接入互联网,进行数据的交互,使得物物相连.随着人们生活水平的提高,物联网正在被逐渐被应用到家庭之中,例如家庭中的安防系统,灯光控制系统,温度检测系统等,物联网技术在家庭中的应用使得人们生活变得更加安
道路是现代交通的主要组成部分,对于管理和更新地理信息系统数据库中的道路信息非常重要。遥感图像数据已经迅速成为自动提取道路网络的主要数据源,它可以提供高精度的地面信息以及更复杂的背景细节,还可以进行大规模的道路监控,给道路提取带来了很大的改进空间,然而目前视觉判读仍然是更新道路的主要方式,这种方式成本高、需要耗费大量的时间和物力,给自动提取道路任务带来了影响。高分辨率遥感图像中的道路具有较大的类内差
人脸表情蕴含着丰富的情感信息,在人际交往沟通中起非常关键的作用,如何让计算机正确的识别理解人脸表情信息是一项具有重要意义且极具挑战性的工作。随着深度学习的发展,利用深度学习技术实现人脸表情识别成为了表情识别领域新的研究热点。人脸表情特征大多集中在人脸的局部关键区域,如眼睛、眉毛、嘴巴及其周围区域,人们可以忽略人脸的整体信息,而直接借助人脸的局部关键区域信息,来正确的识别人脸图像中的表情类别。因此,
随着教育信息化的发展,可视化教学成为教育研究者关注的热点之一。如何运用信息技术将可视化教学与学科教学融合的方式来发展学生的科学素养是亟待解决的重要课题。由于晶体结构与性质内容具有抽象性、微观性和复杂性等特点,并且该内容对学生的空间想象能力和立体几何知识要求较高,因此教师在进行讲授时很费力。2017版课标提出教师可以借助实物模型、计算机软件模拟和视频等多种直观手段,降低教学内容的抽象性,促进学生对相
视觉目标跟踪是计算机视觉领域中的重要研究方向之一,它被广泛应用在很多领域,其中主要应用在视频监控、自动驾驶和军事指导等领域当中。在当前主要以孪生网络作为发展的目标跟踪方法当中,候选目标区域中推荐的质量显得十分关键。模型更新问题也成为相应目标跟踪方法中的重要研究内容。当前跟踪方法大多数都是采用锚点固定作为推荐的一种方式,该方式所生成的候选区域数量都是非常庞大的,但是质量并非很高。并且在孪生网络中,目
基于皮尔逊相关系数的决策树(PCCDT)算法是决策树领域的一种贪婪型算法。其广泛应用于模式识别和信息检索领域,能够帮助医疗机构更精准地对病人进行诊断,帮助企业或个人更好地做出决策等。然而,当数据集中包含个人敏感信息(如病人的诊断信息,顾客的购物信息等),在决策树使用过程中遭到具有一定背景知识的恶意用户攻击时,个人的隐私安全就会受到威胁。如何在决策树使用过程中对敏感信息进行保护,同时又能保证决策树的
随着互联网的迅速发展,网络上存在的信息呈指数级增长,用户从这些海量而复杂的数据中筛选自己感兴趣的内容的难度也随之增加。推荐系统作为一种有效的信息过滤工具,得到了广泛的应用,它的目的是准确地预测用户对物品或信息的偏好程度,从而把对用户更有价值的内容优先呈现给他们,帮助用户做出快速的决策。协同过滤在推荐算法中被广泛应用,它是基于相似用户具有相似偏好的假设进行推荐的,但是当用户的历史评分数据很少或没有评
雾霾是由于空气中悬浮着微小颗粒而产生的。随着数据科学与人工智能的飞速发展,诸如安防监控、智能驾驶、车牌识别、军事勘测、林业预警等基于计算机视觉处理系统的任务对于图像的清晰度有着越来越高的要求,雾霾的存在使得图像采集系统获取到的图像出现可见度降低、模糊泛白、色彩饱和度下降等情况,严重阻碍了基于计算机视觉处理系统的后续任务的有效进行。因此对有雾图像进行有效去雾,使计算机视觉系统能够在有雾霾的情况下正常
随着领域非结构化文本的不断积累,各个应用领域迫切地需要从海量的非结构化文本中挖掘出有用的信息,各种文本挖掘技术也相应地快速发展。在中医医学领域中,中医医案是一种重要的信息载体,蕴含了大量的临床经验,对临床诊断和医学研究有着重大的研究意义。但是中医医案文本不仅具有较强的专业性,而且不同的医生多采用不同的表达形式进行表述,从而给中医知识的获取带来了巨大挑战。中科院计算所NKI课题组提出了一套语义分类和