论文部分内容阅读
近年来,视频监控在构建信息化、智能化的城镇建设中起着至关重要的作用,而行人重识别又是视频监控的重要研究内容。因此越来越多的研究者开始着力于研究行人重识别问题。行人重识别指在多摄像机监控系统中,辨别不同摄像机捕捉到的行人图片是否为同一个人,该应用一般运用在自动跟踪、检索犯罪嫌疑人等监控部门。但是在现实中捕捉到的行人图像一般存在图片模糊、背景干扰、行人姿态的不规律变化等问题,从而导致相同行人在不同摄像头下的外观有较大差异,这些问题给行人重识别带来了巨大的挑战。早期的行人重识别研究主要是借助传统特征提取方法(如颜色、外形、局部描述符)去学习行人的浅层不变性特征。随着深度学习方法在计算机视觉中逐渐成熟,研究者利用深度卷积神经网络去解决行人重识别。首先利用深度学习网络模型去学习行人的代表性特征向量,然后利用距离函数去度量行人特征向量的相似度,从而来判断行人图像是否为同一个人。因此,设计出一种有辨别力且稳定性的特征表示器去表示行人图像是行人重识别任务中最重要的部分。本文基于深度特征度量学习方法,对特征网络和损失函数提出改进方案,在高效解决该类问题的同时获得了当前已知的最好效果。主要研究内容如下:1.详细介绍了行人重识别的基本构成和基本方法。针对行人重识别系统性的介绍了其基本处理流程,然后详细介绍了行人重识别几种重要的研究方法包括特征表示方法和度量学习方法,对各类方法的特点进行了系统的介绍。最后阐述了行人重识别的评价标准和公开数据集。2.受到残差网络和注意力机制思想的启发,针对行人重识别的相同行人在不同摄像头下的外观存在较大差异的问题,普通的网络模型不能提取代表性的行人特征,因此提出增强深度特征融合网络模型:首先在特征学习阶段,主要提取行人的不变特征。其网络模型分为三个分支,一个分支用来学习行人全局特征,第二个分支学习局部特征。在全局分支中,将空间注意力和通道注意力结合提出嵌入注意力网络名为空间-通道注意力网络(Spatial and Channel attention network,SC-Net),再将SC-Net网络嵌入到Res Net50网络中;在局部分支中,提出一种长短时记忆变换网络(LSTM Change Network,LSTM-CN),利用LSTM-CN提取到更具有代表性的局部特征。第三个分支把全局特征和局部特征相融合借助联合损失函数去训练该网络模型。本文的网络模型在多个公开数据集上被验证了优秀效果。3.针对行人重识别任务中相似类别容易错误分类的情况,如果仅从行人的单一尺度去提取行人特征信息会带来局限性,单一尺度提取的行人特征辨别性差。因此,本文又提出一种多尺度网络模型MSN(Multi Scale Network),该网络模型从多尺度角度去行人图像进行分块,每一块提取到的特征向量送入到损失函数去训练网络模型。本文的损失函数摒弃了传统的三重损失函数,为了考虑特定样本带来的影响,把交叉熵损失函数和标签平滑正则化结合起来,有效的解决了训练样本的武断性。本文的多尺度网络模型在公开的行人重识别数据集上取得了较好的实验效果,同时利用基线模型验证了本文方法的有效性和正确性。