论文部分内容阅读
近年来,行人再识别技术凭借其在公共安全等领域的巨大潜力,成为计算机视觉问题中一个研究热点。从本质上讲,行人再识别问题是一个图像检索问题。随着深度学习技术在图像处理领域的广泛应用,卷积神经网络及其衍生网络成为解决行人再识别问题的主流基础技术。针对数据无标签、行人特征区分性不足等在行人再识别过程中亟须解决的难点问题,研究者们提出许多优质的算法框架,并利用公共数据集进行算法验证,取得令人瞩目的成绩。本文在对深度学习技术相关理论梳理、总结和对行人再识别问题的发展历程、经典解决方案与面临的难点进行详述、分析的基础上,进行两方面的创新性研究:(1)针对渐进无监督模型应用在行人再识别过程中行人特征区分性不足问题,提出中心化聚类损失函数的解决方案;(2)对基于Faster-RCNN的行人再识别框架E2E进行改进,使用残差神经网络ResNet-50提取行人特征,优化模型训练过程。针对渐进无监督学习模型中采用Softmax损失函数训练后提取的行人特征可区分性不足的问题,本文设置距离惩罚项,提出了使用中心化聚类损失函数的方法。先利用k-means++生成聚类中心,在模型训练过程中,使相同身份的行人特征向聚类中心靠拢,缩小相同标签特征距离,增强了行人特征的可区分性。设计了对比实验,并将训练过程中行人特征可视化,证明所提出方法的有效性。针对常用行人再识别数据集与实际应用场景相差较大的问题,在端对端的行人再识别框架E2E中,采用ResNet-50替代模型E2E中的AlexNet,让更深层次的网络提取更细致的语义特征,利用区域提议网络产生目标候选的区域,通过多个损失函数联合训练,实现行人检测与再识别过程一体化。在实验中,本文提出的算法与多个传统行人检测算法以及原始E2E框架进行对比,证明了所提出算法的合理性和有效性。图42幅,表7个,参考文献63篇