基于深度学习的行人重识别方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:jwk000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别旨在判断行人在不同的摄像机视域下是否出现过,是图像检索的一个子问题。随着深度学习在计算机视觉领域的广泛应用,基于深度学习的行人重识别已经成为主流模型,并且在效果上远远超出基于传统机器学习的行人重识别方案。但在在实际的应用场景中,由于存在摄像机分辨率太低、姿态变化、光照变化频繁和遮挡严重等一系列问题,行人重识别任务仍然具有很大的挑战性。如何提取对光照变化、姿态变化和遮挡鲁棒的、有区分性的特征表示,显得尤为重要。鉴于全局特征无法摒除行人背景等干扰信息,也无法获得更多细粒度的局部表示,目前的主流模型使用注意力机制来建模全局和局部特征作为最终的行人表示,以抑制背景等干扰信息并获得更多细粒度的局部表示。本文针对注意力机制和分割局部带来的缺点分别提出了相应的改进方案,主要概述如下:针对注意力机制对潜在显著特征提取能力不足的问题,本文在注意力机制的基础上提出了级联注意力增强/抑制网络(Cascaded Attention Enhancement/Suppression Network,CAE/SN),对每个阶段的显著注意力进行提取和增强,而在下一阶段进行抑制,以提取潜在的显著特征,挖掘了多级显著区域,获得了鲁棒的特征表示。针对基于水平分割获取多粒度局部特征的模型无法解决行人部位不对齐问题,本文摒弃简单的水平分块方式,引入了聚类算法生成伪标签作为行人图像的语义监督信息,利用像素级伪标签来确定局部区域并获取多粒度的局部特征。本文将两种改进进行结合,提出了聚类指导级联注意力(Cascade Attention Guided By Clustering,CAGBC)网络,即在显著注意力增强/抑制阶段采用语义伪标签来指导显著区域范围的划分,摆脱了注意力机制对潜在特征提取能力不足问题和水平分割导致的语义不对齐问题,获得了多级的鲁棒的显著特征。将本模型在Market-1501和Duke MTMC两个大规模数据集上进行试验,本文在m AP评价指标上分别获得了88.7%和80.1%的成绩,且在Market-1501数据集上比使用姿态辅助的DSA-Re ID模型超出了1.1%。这表明,在不使用额外语义信息(如姿态检测、人类语义解析)的情况下我们的模型取得了与使用额外语义预训练的模型不相上下的结果,也进一步说明了对于多级显著特征进行提取和用语义伪标签指导显著区域选择的意义。
其他文献
随着信息技术的发展,各类复杂网络层出不穷,识别网络中的关键节点可以在一定程度上帮助了解网络特性,维护网络的结构和功能。关键节点问题(CNP)是NP难组合优化问题,对该问题的研究有着重要的理论价值和应用价值。关键节点问题在于移除图中的某些节点,使得剩余图满足预定义的连通性度量。目前针对CNP问题的算法存在运行时间较久或迭代较多、准确性不够的问题,仍需要进一步的改进与研究。针对6类CNP问题中关注较多
随着无人机技术在智能化战争中的应用越来越广泛,在复杂环境下无人机的自主飞行能力逐渐成为研究的热点问题。为了在复杂环境下实现自主飞行,无人机通常必须具备优秀的自主导航能力。作为无人机自主导航过程中的关键环节,无人机的三维航迹规划不仅空间复杂度高,而且通常需要实现对多个目标的优化。本文围绕作战场景下无人机的多目标三维航迹规划问题展开研究,提出了离线规划和在线规划相结合的三维航迹规划方法,从而得到同时满
指称图像分割是近年来自然语言处理和计算机视觉交叉领域的一个重要研究方向。给定一幅图像和对应的指称表达式,指称图像分割的目的是分割出包含指称表达式所描述的视觉实体的相应区域。作为多模态任务的代表之一,指称图像分割已经被广泛地应用到交互式图像编辑、智能视觉搜索、机器人控制、人机交互等任务之中。虽然基于卷积神经网络的指称图像分割任务已经取得了巨大的进步,但是仍然存在着众多的挑战。大多现有的方法未能充分利
在低温条件下储存保持活力的生物组织,早已被广泛地应用于畜牧、生物及医学方面。我们于1973年开始进行了利用液态氮储存异体皮的研究工作,并已大量应用于临床,成功地抢救了很多大面积深度烧伤病人。但我们发现低温储存皮肤的琥珀酸脱氢酶的活力(改良的Hershey氏法)只为储存前的45—55%左右,利用染料排斥法(dye exelusion)迨盼兰试验(改良的Prows法)也只为
期刊
现今,海洋资源的利用和交互受到很大的关注。以往海洋物联网技术主要是云计算架构,然而大数据时代,云计算逐渐面临网络时延等挑战。移动边缘计算的诞生解决了这些问题。但由于参与者之间缺乏信任以及用户对隐私的关注,需要提出更可靠的解决方案。目前的方案有的利用区块链解决数据安全问题,有的利用联邦学习解决隐私问题,但这些方法并未结合海洋的特殊环境,且未考虑节点的安全性。本文提出了一种基于联邦学习和区块链技术的边
在室内服务机器人技术领域中,自主导航是机器人功能的重要组成模块。在自主导航技术中,路径规划是机器人在应用场景内完成各项功能的技术基础。在全局和局部路径规划技术中,所应用的算法仍存在规划路径不平滑且稳定性不高的现象。本文针对以上问题,以轮式机器人为研究对象,对路径规划技术进行了研究。基于ROS(Robot Operating System)平台完成自主导航系统框架的搭建。为保证仿真和实验的顺利进行,
行人检测作为计算机视觉中一个备受关注的子方向,目的是检测图像或视频序列中是否存在行人,并给出精确的定位,其在智能监控、智能机器人、智能交通、车辆辅助驾驶系统、人体行为分析等领域都有广泛应用。本文以CSP行人检测算法为基准模型,从多方面进行改进模型,使模型拥有更低的漏检率,更快的检测速度和更小的体积。针对行人遮挡问题,本文将注意力机制融入网络,以提升模型在重度遮挡行人集合上的性能。最后将改进模型移植
调制识别是通信领域的一个关键性技术。传统的调制识别技术需要人工提取信号的特征后再进行分类,实现复杂且鲁棒性差。深度学习的快速发展为调制识别技术研究提供了新的思路,但其应用却面临两个重要挑战:一是如何获得更高的识别准确率,二是如何在小样本条件下实现对调制信号的有效识别。针对上述挑战,本文研究实现了一种基于三元组网络的调制识别方法,用于提升调制识别的准确率;研究实现了一种基于关系网络的调制识别方法,用
目前,慢性病是全球最主要的死亡原因,且趋于年轻化,如何降低慢性病的发病率、死亡率及其造成的疾病负担成为了全球所关注的焦点。由于慢性病本身具有潜伏期长、早期症状和体征不明显、常导致多种并发症等特征,加上有限的检测方法、治疗药物以及患者自身的病耻感,均为其诊疗带来巨大挑战。因此,探索疾病产生的机制及其代表性的标识物具有重要意义。脑电(Electroencephalogram,EEG)是一种电生理信号,
随着人工智能技术的快速发展浪潮,各种类型的机器人在人们的日常生产生活中得到了广泛的应用。其中,在能源化工行业中,由于危险气体泄漏引发的重大安全事故不断增加,防爆型巡检机器人也开始得到研究者的广泛关注。尤其是四轮独立驱动与转向的轮式机器人凭借其控制性好、灵活性高和机动性强的特点,在应对高危环境的巡检场景中成为研究应用的热点之一。防爆巡检机器人在执行巡检任务时,需要采用路径规划技术。基于已知环境信息,