基于Zynq的目标检测系统设计与研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:g123838477
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测技术在人们生活中有着广泛的应用。传统的目标检测技术于对于变化多样的目标没有很好的鲁棒性,遇到了难以逾越的瓶颈。随着深度学习技术的发展,卷积神经网络相较传统目标检测技术有更高的准确性和鲁棒性,然而作为一种计算密集型的算法,基于深度学习的目标检测算法在便携式设备上的实现面临着巨大的挑战。理论上two-stage检测器具有更高准确度,但需要消耗大量计算资源和计算时间。one-stage框架下Yolo系列的目标检测算法通过单个卷积神经网络的处理,便可获取预测边界框和类别概率,其检测速度更快,结构更简单。特别是Yolo V4的横空出世在速度和性能上都取得比较好的成绩,且能够被并行优化。综合GPU、ASIC、FPGA三种芯片在数据处理方法、速度、功耗、价格等方面的优劣,最终选由双核ARM+FPGA的异构平台Zynq展开部署研究,主要的研究内容如下:1.在Yolo V4网络模型的模础上,根据嵌入式平台计算和存储资源特点,提出了一种Yolo V4-sim模型。权衡计算延时和精度损失将深度学习算法中的32位浮点型数据量化为8位整型,并优化整个模型的归一化方式,提出BGN(Batch Group Normalization)去替换BN(Batch Normalization),将通道、高度和宽度三个维度合并为一个新维度,将新维度划分为特征组,计算整个小批和特征组的统计量。在预测框提取部分采用边界点增强的提取策略,减少冗余框的数量并过滤掉有害的背景信息。2.根据卷积神经网络硬件加速的基本原理,提出用分层卷积和点卷积去简化计算复杂度,并提出数据旁路思想来提升准确度,并在32bit-8bit量化推理算法的基础上,匹配嵌入式INT16寄存器的特点去设置乘累加防溢出条件约束,虽然检测的平均精度m AP下降了5%,但检测速度提升了6倍左右。3.在PC端进行模型训练,获取特征/权重参数,在Zynq7020搭建软硬件协同设计的目标检测系统,实现Yolo V4-sim模型的实时目标检测。本文基于深度学习的便携式目标检测系统展开研究,权衡检测精度、算法复杂度、功耗、速度等因素的影响,最终实现了低功耗、低成本、高实时性的目标检测系统的设计,检测精度达到了71.7%,目标检测速度达到了24FPS,为以后基于深度学习的目标检测算法的部署及其硬件实现的加速研究提供一定的参考价值。
其他文献
学位
并行计算的基本思路是将计算问题分解成若干部分,再调用多种计算资源来协同求解。传统的中央处理器(CPU)并行计算系统由两台以上计算机构成,计算机之间通过网络交换机进行数据传递,其缺陷是数据的总量会明显降低传递速度。而在基于众核架构的图形处理器(GPU)中,众多核心间可以通过传递效率更高的PCI-E互联开关传递数据。出色的计算能力也离不开优秀的编程平台,英伟达公司为GPU开创了一个简单易用的编程接口,
学位
学位
学位
牛大力作为药材,种植户在种植牛大力时,只是单一的利用其根部入药的特性,而牛大力其他的部位都会被丢弃,尤其是在种植培育的过程中,每年都要对其藤蔓进行修剪,以保证根部的发育,这导致了牛大力的利用率很低,经济价值大打折扣。近年来,市场兴起的牛大力藤蔓茶使牛大力藤蔓有了新的利用方式,但现有的茶叶加工装置不适用于牛大力藤蔓的加工,目前只能靠手工制作,效率低且茶的品质难以控制,亟需牛大力藤蔓茶加工机械化,针对
随着我国基础设施建设的不断深入,交通路网越来越发达,但在交通领域,目前仍然没有一种可靠、经济、实用的测量检测技术能对整体交通路网状态等交通要素事件进行长距离连续监测。近年来,光纤振动传感技术,以其分布式、长距离、全天候监测的技术特点,在例如石油管道泄漏监测、轨道运行监测、长距离周界安防等大型线状基础设施中得到初步应用,但依然面临许多技术上的难题。本文主要以光纤振动传感系统为研究对象,对相位敏感型分
不定权奇异型方程是一类重要的微分方程模型.本文研究由球面上开普勒问题导出的不定权奇异型方程周期解的动力学性质.针对具有两个奇点和一个分段权函数的不定权奇异型方程,本文建立一种新的方法来寻找精确周期解.论文主要结构如下:第一章,介绍不定权奇异型方程的相关研究背景以及发展现状,并简要叙述本文的主要内容和研究特色.第二章,讨论不定权奇异型方程的周期解的存在性问题.首先,构造一系列变换,将方程转化为等价的
学位
学位