论文部分内容阅读
目标检测作为计算机视觉的一个分支,是当下研究十分火热的一个领域,应用前景十分广阔,可用于智能交通,智能监控,自动驾驶等各个领域。它主要的任务是获得图像数据中目标的类别信息和位置信息,需要解决定位问题和识别问题。基于深度学习的目标检测方法是该领域近年来的研究热点,其检测精度和检测速度相比传统检测方法都有着极大的提升。但是由于深度学习是一种计算密集型的方法,它对硬件计算能力有着极大的要求。现阶段常用计算型显卡来进行检测。而由于高性能计算服务器的价格昂贵,功耗较大,使得其搭建成本较高,不易拓展。因此,如何通过其它方式拓展并行处理总量、降低系统总体搭建成本,成为了一种亟待解决的问题。本文设计了一款基于ARM+FPGA异构平台实现的实时目标检测系统,该系统可以作为边缘计算设备在近数据端完成数据的处理,能够达到一定程度的检测效果,可以作为服务器端的先行检测设备,降低服务器端的搭建成本和运算压力。本文首先阐述了目标检测、深度学习的研究成果与研究现状。之后选定了设计所用的硬件平台的具体型号,然后搭建其基于SDSOC套件的硬件支持包,将darknet框架移植到平台后成功进行了检测。为了解决系统运行速度较慢的问题设计了系统优化方案,在硬件端通过SDSOC开发套件设计了通用硬件卷积层加速器。在算法端结合系统实际需求,重新训练yolo神经网络。最后检验了系统优化方案的实际效果。本设计能够实现与服务器端相同的检测效果,并且其功耗大幅降低。在运算速度上,相比单纯的ARM端计算,能够实现提速数倍的效果。