【摘 要】
:
行人重识别(Person Re-Identification,简称Re ID),是计算机视觉领域的热点研究方向,主要解决跨摄像头跨场景下行人的识别与检索,具有重要的研究意义和广泛的应用前景。该技术亦可作为人脸识别技术的重要补充,对无法获取清晰人脸的行人进行跨摄像头连续跟踪。本文以人体关节姿态的图表示为辅助特征,联合深度学习和图推理,重点研究并解决行人重识别特征提取不充分、小尺度行人识别精度低和关键
【基金项目】
:
国家自然科学基金“复合语境下细粒度视频行为检测与识别关键技术研究”(项目号:61772067);
论文部分内容阅读
行人重识别(Person Re-Identification,简称Re ID),是计算机视觉领域的热点研究方向,主要解决跨摄像头跨场景下行人的识别与检索,具有重要的研究意义和广泛的应用前景。该技术亦可作为人脸识别技术的重要补充,对无法获取清晰人脸的行人进行跨摄像头连续跟踪。本文以人体关节姿态的图表示为辅助特征,联合深度学习和图推理,重点研究并解决行人重识别特征提取不充分、小尺度行人识别精度低和关键点之间的关系被忽略等问题,针对性地提出了三种网络模型。本文的主要研究成果如下:(1)提出了一种基于多尺度特征融合的行人重识别网络(Multi-Scale Feature Fusion Network for Re ID,MS-FFN)。MS-FFN通过对不同尺度的特征进行融合,以提升模型的行人重识别性能,增强特征的表示能力,使模型性能有所提升。在Occluded-Duke数据集上的实验结果表明,与目前主流的算法相比(如HONet),所提MS-FFN模型的R1准确率提高了0.5%。(2)提出了一种基于位置注意力的行人重识别网络(Locational Attention Network for Re ID,LANet)。LANet通过将位置信息嵌入通道注意力,联合学习位置和通道特征,从而提高行人重识别模型的性能。在数据集Occluded-Duke上的实验结果表明,与主流的HONet相比,所提LANet模型的R1准确率提高了1.1%。(3)提出了一种基于图推理的行人重识别网络(Graph Reasoning Network for Re ID,GRNet)。GRNet通过将特征映射到一种隐层交互空间,然后用图卷积进行关系推理,最后将带有关系信息的特征映射回原始坐标空间,从而得到更深层的关系表示。在数据集Occluded-Duke上的实验结果表明,所提GRNet的性能优于上述LANet、MS-FFN和HONet模型的性能,模型的R1准确率分别提高了3.1%,3.7%,4.2%;在数据集Market-1501上的结果表明,相较主流算法(如PGFA),m AP和R1指标分别提高了5.9%和1.5%。
其他文献
付费会员的经济模式近年在国内各个利于飞速发展,通过付费成为会员可以享受更优惠的价格和更高平直的服务,付费会员的经济模式正成为消费的新常态。付费会员的经济模式通过个人和企业奖励一种正式的、可持续的关系,企业为会员推出了更加优质的服务,会员增加该企业的消费总额和频率。互联网领域会员经济随着生态的竞争而迎来了爆发增长。一方面,全球互联网会员已形成规模,亚马逊的会员用户数在2018年超过1亿。另一方面,随
随着工业4.0概念的兴起,工业领域也正发生着智能化转型的热潮。在实际的工业场景中,借助于云计算和边缘计算技术可以提升工业物联网中生成数据的处理效率,但数据泄露造成的隐私问题也正在损害着人们的利益。针对该问题,众多学者利用基于密码学理论的数学加密方法进行了较多研究并取得了一定的研究成果。但本文方案不同于调研的数学加密等方法,而是从新的角度考虑该问题,利用区块链去中心化、防篡改以及可追溯的技术特性,通
为了增加机器人的适应场景和应用范围,轮腿式机器人应运而生,其中轮腿共同驱动式机器人控制简单,可靠性和地形适应能力一般,轮腿独立驱动式机器人可靠性和地形适应能力强,控制复杂。本文利用单环闭链机构可靠性强,控制方便的特点,将两种单环闭链机构相结合,提出具有两种运动形式的单环闭链变胞机构,根据闭链腿式机器人的布置原则构建可变形轮腿共同驱动式机器人,进行了理论分析、仿真和样机试验研究。首先,将Chebys
基于静息态功能磁共振成像(Resting-state functional Magnetic Imaging,rs-f MRI)的脑指纹是指rs-f MRI信号中存在着独一无二的特征,可以用来表明个体的独特性,然而与脑指纹识别最相关的特征至今仍没有统一的定义标准。人类连接组项目的发布以及机器学习、深度学习的发展,为脑指纹的探索奠定了技术基础。基于rs-fMRI的脑指纹识别,大多采用全部的静态功能连
在OA系统运维过程中,某公司信息部门经常接到用户各式各样的需求。所有用户都想快速、完全实现自己的需求。由于时间、资金、人员数量等资源有限,考虑到诸多方面的要求,如何正确处理交付需求的先后顺序,就显得极为重要,这就是需求优先级。但是信息部门常常凭直观经验来判断需求优先级,有时会造成资源分配不合理、需求安排不科学,进而受到用户投诉,对年底的部门评比结果造成一定影响。为改善这种状况,就需要搭建一套判定需
目前,城市交通路口摄像头产生的海量交通数据可以应用于交通管理、智能安防等领域。因此,对特定车辆进行检索,即车辆重识别(Vehicle Re-ID)就变得十分重要。车辆重识别任务是指:在给定一张测试图像的前提下,找出跨摄像头拍摄的同一辆车的图像。2012年后,随着算力的大幅提升和海量数据的产出,深度学习方法在各个领域不断刷新着最佳性能的纪录,包括车辆重识别任务。尽管近年来车辆重识别的方法多样,但是少
在当前共享经济的时代下,共享汽车正作为一种绿色、经济、便捷的出行方式融入人们的生活。为了深入了解共享汽车整体运营特征,本文在现有研究基础上,选取共享汽车订单数据、兴趣点(POI)数据、天气数据作为研究数据基础,刻画共享汽车出行时空分布特征;通过构建POI密度指标负二项回归模型,着重分析兴趣点因素对共享汽车出行需求的影响关系,为运营商进行新站点的选取提供科学支撑;运用深度学习网络模型实现站点每日借还
伴随着信息时代潮流的推进,深度图像在物体检测、行为识别和场景建模等方面的应用越来越多。由于3D成像系统本身缺陷和外界干扰,采集的深度图像中往往带有孔洞,孔洞是限制深度图像实际应用的主要因素之一。目前大多数深度图像孔洞填充采用基于彩色图像引导的修复方法,复杂的采集设备和彩色图像与深度图像间的对齐精度一定程度上限制此类方法的应用。基于此背景,本文专注于基于单一深度图像信息的孔洞填充方法研究。论文取得了
运用基于心流理论的交互界面研究方法,针对骨折复健类应用程序的用户心流体验,以典型骨折复健类型——胫腓骨骨折复健为例,进行界面设计,以及完成配套智能可穿戴硬件的设计。通过对用户特征及其心流体验要素的分析,确立研究路线的可行性,梳理完整的用户体验交互流程,探讨用户的心流体验预期及达成心流体验的路径,得出符合目标界面效果的设计结论。在用户调研中,通过对其痛点的剖析,对用户骨折复健全流程的真实情况进行分类
基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的算法在计算机视觉领域拥有至关重要的地位,相比与传统算法,其针对图像分类、目标检测、实例分割等任务均具有更高的准确率,成为近年来学术和工业界的主要研究方向。然而,由于DCNN固有的高计算负载、高参数量的属性,针对功耗、存储限制较为严苛的场景,实现高吞吐率、低延时的推理运算仍然面临诸多挑战。本论文提出