基于图卷积网络的视频行人重识别研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:ylw962203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是视频监控工作中的一项重要任务,在相机无法获得高质量的人脸图像时,利用身体特征、步态动作等更为全面的信息继续识别目标,无论是单独使用还是与人脸识别技术相结合,都能发挥重要的作用,在计算机视觉领域有重要的学术研究意义。目前,基于单帧图像的行人重识别研究已经获得很大的进展,但图像的信息有限并对图像质量有较大的要求。考虑到基于视频的行人重识别方法不仅关注单帧图像的信息,还能够利用帧与帧之间的时序信息,本文针对视频行人重识别任务中存在的遮挡、视觉模糊等挑战性问题展开研究,主要工作和研究成果包括:1)提出一种基于行人属性图卷积网络的视频行人重识别方法。受多任务网络的启发,考虑到行人属性能提供更加细粒度的特征进而捕获到不同行人之间的细节差异信息,将属性特征融入到行人重识别任务中。该方法分为行人属性预测分支和行人重识别分支。行人重识别分支将属性预测分支得到的局部属性特征和行人全局特征相融合得到更全面的行人特征,并输入图卷积网络学习不同视频帧间特征的潜在联系,提取到鲁棒性强的辨别性特征解决行人重识别任务中存在的遮挡、视觉相似等挑战性问题。在数据集MARS上的实验分析表明,本文提出的方法取得了较好的识别效果,能够有效提升识别性能。2)提出一种改进的行人属性图卷积网络的视频行人重识别方法。针对部分视频帧中存在属性信息过少、缺失等问题,引入空间注意力机制和通道注意力机制挖掘显著的行人局部属性特征,提升融合特征的表达能力,捕获相似行人之间细微的辨别性特征以更好地完成行人重识别任务,在数据集MARS上实验验证了本章改进方法的识别准确率和有效性都得到提升。
其他文献
本文以MIT Cheetah Mini四足机器人为参照对象,制作了一款全膝式串联腿部结构的四足机器人,设计出一种基于足端触地驱动的四足机器人步态实时规划及控制算法,同时建立了四足机器人足端触地有限状态机,有效的提高了四足机器人经过凹凸地形时的稳定性。根据四足机器人机械结构求解出运动学正逆解方程,然后分析其平地环境下运动步态的描述方法和几种典型的步态形式,并聚焦到Walk和Trot步态;运用多项式曲
随着我国经济的蓬勃发展,服装企业的数量呈现爆发式的增长,商家在广告上大做文章,各种各样的运动服饰广告语出现在人们的面前。在运动服饰品牌迅速发展的同时,广告主在进行媒体投放时越来越注重运用多种多样的修辞手法对广告语进行包装,以求让每一次的广告投放产生不一样甚至轰动的效果,取得经济效益和社会效益的双丰收。本文以运动服饰广告语修辞手法的运用为研究对象,通过列举大量实例,对运动服饰广告语的特色、运动服饰广
遥操作机器人系统能够将人的智慧与机器人相结合,拓展机器人的工作能力,目前已经在各个领域得到了广泛的运用。本文设计了一种基于连续快速非奇异终端滑模控制与快速终端滑模观测器相结合的遥操作机器人系统控制算法。该算法可以在时变时延的情况下,实现主从轨迹快速且稳定地跟踪,使得系统误差能够在有限时间内收敛,且从端机器人与外部环境的交互力能完全反馈回给操作者,并具有较强的鲁棒性。首先,分别采用了指数积法和D-H
近年来,随着信息时代的发展,人脸表情识别已经成为了计算机视觉领域的一个重要课题,广泛地应用在人机交互、医疗辅助、在线教育、安全驾驶等领域中。针对目前人脸表情识别存在的一些挑战性问题,本文结合深度神经网络,从特征提取、数据库的局限性、卷积神经网络优化、损失函数的改进等多方面展开研究,主要工作内容如下:(1)考虑到单一特征不足以表征人脸信息,本文提出了一种基于局部二进制模式(LBP)和梯度特征的双通道
随着科学技术的不断进步,焊接产业向着智能化和自动化的方向发展,焊接机器人已广泛应用于工业生产等领域。而移动焊接机器人在焊接环境行进及作业过程中需要对周围障碍物进行识别,为移动焊接机器人的下一步运动控制提供依据。本文在自主研发的移动焊接机器人平台上开发视觉传感系统,确立了一种基于双目视觉的障碍物检测与定位方案,通过实验验证了方案的可行性。主要研究内容如下:(1)本文搭建了双目视觉系统,设计了相机夹持
糖蛋白是一类参与多种生理和病理过程的重要生物分子,其在多种生命活动中发挥着重要作用。糖蛋白在体内的异常表达与多种生理病理密切相关,因此被广泛认为是临床诊断的生物标志物之一。在临床诊断中,实现糖蛋白的即时检测(Point of care test,POCT)对疾病的早期诊断和患者生存率的提高具有重要意义。目前,酶联免疫吸附试验(Enzyme linked immunosorbent assay,EL
场景图生成任务是指从图像中检测目标类别和推理目标间关系,并利用图结构来简洁且结构化地描述图像。它是沟通自然语言与计算机视觉的桥梁,近年来成为图像理解领域的热门研究方向。深度学习也已成为图像理解的有力工具。然而现有的场景图生成方法仍然存在两个问题。问题一是现有的场景图生成方法推理得到的关系多样性较差。一方面,特征不完善会导致关系多样性受限。现有方法单纯利用视觉特征进行类别推理,相似关系之间的差异性较
脑机接口(Brain Computer Interface,BCI)作为一种新型信息沟通控制手段,是一个涉及神经科学、信号处理以及模式识别等多个学科的交叉研究课题。基于运动想象的BCI系统被认为是最具有发展前景的一种脑机接口系统。针对基于机器学习方法构建脑电特征与运动想象之间映射关系进行分类时,现有方法仍存在着无法兼顾脑电信号的时-空域特征,并且分类精度难以提高的问题,本文开展基于注意力机制的双向
皮肤触觉感受器因接受机械刺激而产生的感觉,称为触觉。通过仿生触觉传感器,机器人也能捕捉因相互接触而产生的物理交互信息。本文面向现代机器人触觉感知的实际应用,针对目前多传感融合所面临的实际问题,依据现代稀疏编码相关理论和最新研究进展,进行理论和实验研究,实现多传感信息互补以提升机器人对环境的感知能力。本文的主要研究工作如下:首先,针对稀疏联合组套索模型的优化求解问题,本文构造了一种基于近端梯度下降法