论文部分内容阅读
行人重识别是指具有不重叠视场的多摄像机网络中的行人匹配,它可以从多个摄像头捕获的行人图像中识别出给定的行人目标。行人重识别问题在智能视频监控中有极高的应用价值,具有重要的研究意义。本文提出了一种基于深度学习的行人重识别算法,应用于实验室、教室等需要对识别匹配行人目标具有一定实时性的场所,并在FPGA(Field Programmable Gate Array)上对该算法进行实现和验证。本文主要研究内容和结论如下:本文首先介绍行人重识别相关基础理论,通过分析各类行人重识别的算法优缺点后,最终选择基于深度学习的方法解决行人重识别任务;随后,介绍了深度学习中卷积神经网络的基本原理,并详细分析了基于深度学习算法的Improved DL网络。为使Improved DL网络模型结构在本文的应用场景下完成对实时性的要求,因此提出了改进的基于深度学习的行人重识别算法,在满足该场景对行人重识别算法性能需求的情况下,提升单次行人重识别速度,减少网络运算量。本文实验中对Market1501数据库训练测试结果表明,行人重识别速度优于Improved DL网络。在完成算法设计的基础上进行硬件的实现与验证。由于FPGA在运算速度和功耗方面具有一定优势,因此采用FPGA这种硬件实现方式增加硬件资源,加速其计算过程。本文的硬件设计框架主要包括网络运算模块、SD卡(Secure Digital Memory Card)控制模块、SDRAM(synchronous dynamic random-access memory)控制模块和顶层控制模块,其中网络运算模块负责运行网络的数据计算工作;SD卡控制模块负责存储行人图像数据与网络参数,SDRAM控制模块负责缓存网络参数和网络运算模块中的数据,顶层控制模块保证行人图像数据的正确读取,网络运算模块数据的正确计算,各层间缓存数据能及时写入与读出,协调各模块运行。本文使用Verilog语言对硬件整体设计进行寄存器转换级的描述,并对硬件各模块进行功能仿真验证其逻辑功能。最后在整体硬件程序编译综合后下载到FPGA开发板,验证了算法硬件实现的正确性与可行性。