基于注意力机制的行人再识别研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:sunzheng_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度神经网络的迅速发展和对智能视频监控需求的日益增长,由摄像头组成的监控网络覆盖了城市街道的各个地方。视频监控系统是城市安全防控的重要辅助手段,当发生犯罪行为时,如何利用不同摄像头中采集的众多行人图像对目标行人进行追踪和检索就有了重大意义。行人再识别技术因此成为视频监控系统中不可或缺的技术之一,这无疑是一项极具挑战的学术研究。利用计算机视觉技术来判断不同摄像机下的行人图像是否为同一人,就涉及到怎样从行人图像中提取出具有辨识性的特征以及设计出更好的距离度量方法。然而在真实场景下,行人再识别技术仍然面临着诸多挑战,例如光照、障碍物遮挡、行人图像分辨率不同、行人姿态差异、摄像头拍摄角度不同等问题。鉴于其研究影响及实践的重要性,使得行人再识别的研究受到学术界的广泛关注。针对上述行人再识别技术中遇到的难题,本文提出以下两种算法:1.针对行人图像姿态差异和行人图像不对齐的问题,提出一种基于姿态引导及特征对齐的行人再识别算法。利用Openpose定位出人体姿态点信息,将人体姿态信息融入全局特征的表示中,利用基于人体关键点的硬注意力机制,强迫网络关注行人姿态特征;并利用人体关键点实现行人图像间的同一身体部位对齐,进而实现行人再识别任务。2.针对行人图像中的背景噪声会影响网络过度关注无用信息的问题。本文提出一种基于注意力机制及多尺度特征融合的行人再识别算法。第四章中所提算法利用最后一层特征协同多个中间层特征,采用自上而下递进求和的金字塔式的特征融合机制来提取行人图像特征,分别采用最大池化和平均池化保留图像中的显著性信息,并将注意力模块加入网络中,确保实验模型在总体特征表述的基础上,提高对细节信息的表征能力。本文所提出的两种行人再识别算法,有效解决了行人图像不对齐和网络过分关注无用图片信息等问题,在三大主流的行人再识别数据集上经过测试后的实验数据表明,所提的两种算法具有一定的优越性。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位