基于多维注意力的无监督行人重识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:minifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,视频监控在构建信息化、智能化的城镇建设中起着至关重要的作用,行人重识别作为视频监控领域的关键技术,受到工业界与学术界的越来越多的关注。现有的行人重识别的工作大部分聚焦于监督学习,它们假设可以为每一对相机视图提供大量手动标记的匹配对,来学习该相机相对优化的特征表示或匹配度量函数。然而,这种规模的手动标签不仅在现实世界中收集起来成本非常昂贵,而且在许多情况下也是不可行,例如可能没有足够的训练人员在每对相机视图中重新出现。这限制了模型在真实应用场景中的可扩展性和可用性。因此,本文提出了一个多维注意力网络和部件关注网络联合学习的无监督行人重识别方法。本文的主要研究内容如下:1.阐述行人重识别任务问题的起源,课题的研究背景及意义。简要介绍了行人重识别的基本流程与相关理论基础,整理与总结了行人重识别常用研究方法,分别介绍了监督学习,无监督学习和基于注意力机制的行人重识别方法,介绍行人重识别常用的数据集与性能评价指标。2.由于相机视角差异、行人姿态变换、遮挡问题和背景杂波的影响,导致相同行人背景迥异,为了解决这个问题,本文提出了一个多维注意力网络(MultiDimensional Attention,MDA),该网络可以对注意机制中复杂的高阶统计信息进行建模和利用,从而捕捉到行人之间的细微差异,产生有区别的注意建议,从而解决相机视角、背景杂波等带来的影响。3.虽然一些基于局部特征的行人重识别模型被提出来并且超过了全局特征学习方法。但是在未标记的数据集上提取易区分的局部特征仍然是行人重识别中尚未解决的问题。基于此,本文提出了一个部件关注网络(Part Focus Network,PFN),该网络通过设计不同的分支使得每个分支关注不同的部件,然后再进行部件特征融合得到最终的行人特征表示。为了有效的指导PFN在无标签数据集上学习有区分的局部特征,本文提出了一个基于部件的损失函数,同时为了进一步挖掘图像间的潜在信息,提出了基于图像级的损失函数。本文在数据集Market-1501和Duke MTMC-re ID进行模型评估,实验结果表明,所提出的基于多维注意力的无监督行人重识别算法能够提高网络模型在未知数据域的泛化能力,显著提升模型在无监督跨域行人重识别的准确度。
其他文献
当前,情感计算(Affective Computing)在人工智能(Artificial Intelligence,AI)领域,扮演着重要的角色,而脑电信号(Electroencephalograph,EEG)在反映人类情绪状态上有着非常大的优势,已经被广泛地应用于情绪识别。近几年以卷积神经网络(Convolutional Neural Network,CNN)为代表的深度学习技术被越来越多地应用
北斗卫星导航系统是中国自主研发、独立运行的全球定位系统。随着导航技术的不断成熟,对定位精度都有了更高的要求。在定位过程中,削弱多路径效应、探测与修复周跳,动态定位过程中的姿态角解算是高精度定位的重要技术支持。为了实现北斗系统的高精度定位,本文具体研究的内容如下:(1)为了削弱多路径效应对定位精度的影响,本文采用数据后处理方式,先用最小二乘法迭代出初始位置,利用改进的卡尔曼滤波算法对系统噪声和量测噪
“十三五”期间,我国建设了世界最大的信息通讯网络,互联网基础设施建设全面推进。截至2020年12月,我国手机网民规模将近10亿人,移动应用增长势头趋于稳定,亟待规范APP设计流程,提升用户使用体验,给移动应用带来新的增长点。研究将优化交互设计路径为切入点,强化设计过程中的理性推导能力,减少对感性因素的依赖。本文以公理设计原理和方法为基础,基于公理设计框架映射交互设计流程,解构了公理设计的用户域、功
傅里叶叠层成像技术(fourier ptychographic microscopy,FPM)是2013年之后提出的一种新型超分辨率成像技术。傅里叶叠层成像技术主要由结构照明、叠层成像、相位恢复三个部分构成,首先通过采集端获取大量低分辨率图像,再利用空域和频域中的约束条件进行迭代来实现样本的大视场、高分辨率图像的重构。但传统的傅里叶叠层成像技术仍然存在着采集的低分辨率图片质量差,算法计算成本高,迭
随着计算机网络、物联网和便携式通讯设备的普及,当今社会正处于信息爆炸的时代。复杂多样的通讯环境,使信息安全问题受到了广泛关注。真随机数生成器(True Random Number Generator,TRNG)和物理不可克隆函数(Physical Unclonable Function,PUF)是基本的安全原语,广泛存在于数字签名、证书生成和芯片认证中,并作为公钥、初始化向量、填充值在信息安全领域
液晶(Liquid Crystals,LCs)在现代电子学中占有独特的地位,因为它已成为液晶显示器(Liquid Crystals Display,LCD)、光调制器、光学和生物传感器等器件中必不可少的组成部分。纳米粒子掺杂液晶可以改善其光电性能,提高液晶器件的响应。其中量子点掺杂不仅对液晶的性能有所提高,量子点还由于自身的尺寸均匀性和荧光可调的性质拓宽了液晶的应用范围。全无机卤化物CsPbX3(
随着我国招生规模的不断扩大,加上办学条件的极大改善,许多高校根据自身发展规划新建或改造了教学楼、科研楼、实验楼、宿舍楼等。学生人数的增加、建筑面积的扩大以及各类耗能设备的增多,导致高校能耗始终居高不下。能耗支出已成为高校日常运营支出的重要组成,在一定程度上增加了高校的经济负担。因此有必要对高校的建筑开展能耗监测和管理,以提高能源的利用率,降低高校运营成本。论文在深入分析高校能耗监测管理现实需求及现
无线信道场景环境复杂多变,为了提升通信系统的性能,需要对各信道场景配置不同的物理层技术,此时对无线信道场景进行准确的识别尤为重要。在信道场景识别研究中,不同信道场景的小尺度衰落统计特性差异明显,因此可以将其作为信道场景的特征。采用小尺度衰落统计特性分析方法可以获取符合信道场景要求的特征数据,能够进一步提升识别准确度。本文围绕小尺度衰落统计特性分析的瑞利信道场景识别问题展开理论与应用研究,主要研究工
本文以内蒙古呼伦贝尔市谢尔塔拉镇为研究区,在对耕地土壤养分(有机质、全氮、有效磷和有效钾)相关数据进行测定、收集的基础上,借助遥感光谱、空间统计学和GIS时空分析技术相结合的方法,经适用性分析,构建并优选了典型黑土区土壤养分预测模型;进而创新性的提出了能够定量消除耕地扰动因素的预测模型优化方法;最终,基于优化模型对典型黑土区近十年耕地土壤养分地球化学特征和耕地质量进行了综合评价。主要研究成果有:(
随着科学技术和制造工艺的不断发展进步,CMOS技术器件的特征尺寸也越来越逼近物理极限,给电路带来如短沟道效应、互连延时及寄生效应、功耗高等问题。这些问题严重制约着集成电路的进一步发展。因此,研究人员开始转向研究新型纳米技术器件以期替代传统CMOS器件。20世纪90年代提出了量子元胞自动机(Quantum-dot cellular automata,QCA),具有运算速度极快、集成度高和低功耗等优良