融合全局特征与局部特征的行人再识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:mkl119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展和公共安防需求的增加,智能监控系统的部署成为了一种流行趋势,其核心是行人再识别技术。本文首先简要介绍了行人再识别研究的意义、现状、挑战;接着深入研究行人再识别的理论知识,概述了行人再识别发展至今的经典算法;然后针对行人图片错位、遮挡、无关信息干扰等问题,对融合全局特征与局部特征的行人再识别算法进行研究,以上述两种类型特征的有效提取方法为切入点,做了以下研究工作和算法创新。第一个工作是提出一种结合金字塔卷积和水平条纹的行人再识别算法。该模型有两个支路,一个用于全局特征提取,另一个用于局部特征提取。全局特征提取时,不同图片中行人尺寸、位置不同造成无关背景信息干扰网络分类预测结果,针对该问题,使用有多尺度卷积核的金字塔卷积学习不同尺度下的行人深度特征表示,提取不同图片中大小不一的行人全局特征。局部特征提取时,针对行人姿态变换、错位等问题,使用经典的特征图水平分块方法。对两个支路提取的全局特征和局部特征进行特征融合得到具有鲁棒性的特征表示,最后进行分类预测。延续上述算法结合全局信息和局部信息的思想,并在其基础上引入度量学习方法和特征图竖直切分方法,提出一种多方向分区网络结构的行人再识别算法。该模型有三个分支,分别为一个全局分支和两个局部分支。在全局特征提取时,使用度量学习方法在特征空间内拉近相同行人的图片并推开不同行人的图片,有效降低了图片中无关背景信息对全局特征提取的干扰。提取局部特征时,在第一个工作的基础上增加了特征图竖直切分的方法,水平和竖直切分相结合使模型提取到鲁棒性更强的局部特征。最后,在多个数据集上进行大量实验与综合分析,结果表明本文所提算法均性能良好,能有效提取全局特征和局部特征。其中第二个算法性能更优,在跨模态素描数据集上依然表现优异,表明该模型具有较强的鲁棒性和泛化能力。
其他文献
随着城市轨道交通的快速发展,自动驾驶技术应用于轨道交通的研究也逐渐增多。一方面,单一传感器由于其覆盖面单一、鲁棒性差等缺点,难以满足轨道交通自动驾驶中面对的复杂感知环境;另一方面,由于轨道交通所特有的轨道界限特征,准确判断出障碍物目标是否侵限轨道,对自动驾驶有轨电车安全行驶至关重要,而传统的利用相机识别轨道方法对环境、光照和天气依赖较大,且识别距离不能满足要求。本文根据现代有轨电车的应用场景搭建了
目标检测作为计算机视觉领域的重要任务,无论在学术界还是工业领域都备受关注,在现实生活中诸多方向上都应用了目标检测技术,如自动驾驶、智能监控和三维重建等。基于卷积神经网络的目标检测模型在检测任务上表现出优越的性能,然而网络层数和各种性能提升模块的堆叠,带来高准确性的同时也降低了检测速度,作为实时目标检测算法YOLOv3通过改进残差网络,在速度与精度上实现了较为完美的平衡。所以,基于YOLOv3对残差
城市绿地资源对支撑经济社会发展规模,维持良好生态系统发挥着越来越重要的作用,但城市绿地资源信息管理工作仍存在着资源分散,管理平台整合度低,业务协调度低,城市相关绿地信息资源共享不够等问题。本文通过收集研究区的绿地资源以及相关基础地理和环境资源数据,建立研究区基础地理与资源数据库,综合利用GIS技术和互联网开发技术,通过平台架构设计及关键技术的研究,基于WebGIS技术,采用“SOA”面向服务架构思
傅里叶叠层显微成像技术(Fourier ptychographic microscopy,FPM)是一种可以同时兼顾高分辨率和大视场的新型成像技术,它主要是由结构照明、叠层成像、相位恢复三大部分组成。在基于LED阵列照明作为光源的传统FPM系统中,通过依次点亮光源阵列中的LED,由于各位置LED对样品的照射角度不同,可以采集一组包含不同频域信息的低分辨率图像,这些图像随后通过相位恢复算法,在傅里叶
随着物联网(Internet of Things,Io T)以及边缘计算的发展,数据安全问题逐渐成为研究热点。由于Io T场景复杂多样且存在较多资源受限平台,传统的密码算法难以进行有效部署。针对已有的认证加密方案资源消耗大的问题,本文采用轻量级分组密码算法与伽罗华/计数器模式(Galois/Counter Mode,GCM)相结合的方案,实现了Io T场景下的轻量级认证加密引擎。本文在深入研究GC
当下网络技术不断创新,互联网行业自身发展趋于成熟,与各领域的关系愈发密切,互联网产品数量呈爆发式增长,导致产品同质化严重、用户流失、获客成本高昂等问题。用户使用APP过程中的决策行为,是APP用户的长期稳定使用产品的关键。聚焦APP用户不同决策场景与阶段的情感体验,以情感代入的方式来引导APP用户使用中的决策行为,维持良好的情感关系,形成稳定的使用习惯,是本文研究的重点。本文基于APP用户情感代入
光场相机是一种新型的多目成像设备,通过单次拍摄可获取场景的空间和多视角信息。利用光场数据可以估计场景深度,在三维重建等计算机视觉领域具有广泛应用。目前,基于深度学习的光场深度估计性能得到了显著提升,但随着输入成本的增加以及网络的加深,现有的光场数据集难以支持大规模网络的训练。同时,经过合成场景训练后的网络,在真实场景下的估计效果不佳。围绕上述问题,本文对光场重聚焦原理以及EPI图像进行分析,开展光
随着互联网时代的发展,信息安全问题日益突出,数字水印作为版权保护和身份认证的手段备受关注。它常用于地质勘察和军事通信等领域。为了保护勘察信息,同时避免图像被恶意盗取和篡改,人们将需要保护的信息当作水印嵌入到图像中。又由于户外勘察会受到天气的影响,遇到雾霾天气时会使拍摄到的图像质量降低。为了提高图片的质量,去雾也成为研究的热点问题。针对以上问题,本文提出一种基于去雾加速器的数字水印系统,在去雾的同时
目前,全国主要的医疗机构基本上都搭建各自的网上预约挂号系统或者电话挂号系统,但是从近些年的运行效果来看,预约挂号的放号量和使用率都不高。而且存在一些问题,如上办事大厅虽然有统一接入平台,但是预约挂号的提示不明确,医院出诊表不统一,存在各式各样现象,人机交互程度较差,群众使用起来极为不便等问题,有些还是单一PC端网站预约挂号平台,这些平台已难以满足患者的需求。随着移动互联网技术已经突飞猛进发展,预约
生物特征识别技术是最有效的个人身份认证解决方案之一。随着生物特征识别技术的广泛应用,生物特征识别数据库的规模不断扩大。在这种情况下,快速匹配和检索技术越来越有必要。掌纹识别技术是近年来新兴的生物识别技术之一。在掌纹识别技术中,有多个子类别,包括低分辨率掌纹识别和三维掌纹识别技术等。研究者们已经提出许多掌纹识别算法。而对快速的掌纹检索的算法研究还处于起步阶段。哈希技术是最流行的图像检索技术之一,由于