基于轻量级神经网络的行人检测技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xulinsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着行人检测技术的应用场景不断增多,其研究的价值和意义也越来越大。由于深度神经网络在行人检测任务中表现出良好的性能,目前大部分行人检测都采用基于深度神经网络的算法实现。然而深度神经网络存在参数量和计算量大的特点,在一些资源有限的小型终端设备中难以进行应用。针对这个问题,本文首先提出了一个基于轻量级神经网络的行人检测算法,包括两个技术点:两阶段轻量级行人检测网络和自适应区域聚焦技术。两阶段轻量级神经网络通过第一阶段网络生成初始边框并进行初步筛选,再通过第二阶段网络对前阶段保留的边框进行重新评估和筛选,网络具有参数量和计算量极少、网络结构简单的特点。自适应区域聚焦技术是针对视频流的连贯性特点,根据前一帧图像的检测结果减少后一帧图像的外围冗余信息。本文提出的两阶段神经网络总参数量仅为0.73M,对于224*224的输入图像网络的运算量为1.04B次(10.4亿次),在同等尺寸输入图片的情况下,参数量和运算量远小于其他基于神经网络的行人检测算法。在经典的Caltech行人检测数据集测试得到准确率为85.18%。其次,本文针对上述算法分别采用基于FPGA神经网络IP的方式和基于自研神经网络加速器的方式设计了两套FPGA硬件系统。基于FPGA神经网络IP的硬件通过调取DPU神经网络IP核的方式进行设计,具有通用性强、便于移植的特点,其图像处理速度为每秒16.3帧。基于自研神经网络加速器的硬件系统通过自研神经网络加速器的方式进行设计,具有处理速度快的特点,其图像处理速度为每秒25.2帧。
其他文献
多元时间序列预测是机器学习领域非常重要的问题,可以应用在多个领域,比如电力消耗、交通拥堵情况以及疾病预测等。随着时间维度的引入,数据的维度和规模会大大增加,因此会带来一系列问题,比如梯度消失、梯度爆炸、以及无法很好地捕捉数据短期和长期间的依赖关系等。在医学领域,急性肾损伤(Acute Kidney Injury,AKI)需要医生根据患者的历史状态进行经验性的诊断,根据患者的真实数据本文发现医生对于
基于相敏光时域反射仪(Φ-OTDR)的分布式声波传感系统(DAS)被广泛应用于安全监测。真实环境中振动源时变与干扰时刻存在,导致采集的DAS传感信号比在安静环境或实验室环境中更易出现未知畸变和冲击,这意味着实际环境中信号实际蕴含的振动模式易被其它干扰振动源的振动模式掩盖,信号特征易被其它干扰振动源的特征模糊化甚至擦除,使得时变、多振源干扰的复杂环境下振动源识别难度大,识别率亟待提高。为了解决这一问
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)作为一种多载波调制技术,以其高频谱效率、对多径效应的鲁棒性、以及基于快速傅里叶变换的可实现性而备受关注,目前已经在现代通信系统中得到了广泛应用。然而,在OFDM系统中,较大的信号包络波动是其主要的缺点。由于发送端的放大器(Power Amplifier,PA)的线性范围有限,若信号峰值过高
随着互联网的迅速发展以及用户的激增,网络流量数目正在攀升,网络环境也变得日益复杂。为了实现网络管理和网络安全的需求,网络流量分类技术研究的重要性越发凸显,但传统的流量分类方法已经不能适应现代互联网的发展趋势。而随着人工智能领域的蓬勃发展,越来越多的研究者开始将机器学习技术应用在网络流量分类方法的研究之中。虽然已有很多研究为网络流量分类领域做出了有价值的贡献,但仍存在着一定的问题。真实网络环境中,获
语音关键词检测是近年来新兴的、热门的一项技术,此项技术能够从环境中检测特定的语音内容,目前已经得到了广泛的应用,比如智能音箱、语音助手等。近年来,由于神经网络在各个领域的成功应用,这也极大地促进了语音关键词检测技术的发展。尽管当前主流的关键词检测技术在预置关键词上已经能够获得极高的识别准确率,但是却仍然存在无法支持用户自定义关键词,或者在自定义关键词准确率极低的问题。为了解决上述问题,本文创新性地
在众多物联网的新兴技术中,数能一体化网络技术由于其能够延长能量受限节点的寿命,受到了相当大的关注。而自适应调制、发射功率控制等链路控制技术能够在不同信道等环境条件下,通过调节链路控制方案,来提高吞吐量、可靠性等性能。因此,在数能一体化网络这种新型通信网络中引入自适应链路控制技术是很有必要的。在过往的数能一体化网络技术的研究中,很少研究涉及自适应调制、自适应功率控制、自适应能量传输控制以及自适应多用
在机器学习领域内,随着近年来训练样本数量爆炸式提升以及训练模型的不断增大,单机性能难以支撑人们的训练需求,分布式机器学习成为了越来越多研究者的选择。在分布式机器学习中,训练任务由服务器集群完成,集群中的不同工作节点之间需要共享局部数据并聚合局部模型。因此,相较于单机机器学习,通信量的大幅提升是分布式机器学习平台的重要特点。对分布式机器学习平台通信调优也成为了提升其效率的一大关键。目前已有的分布式机
机器学习与深度学习已经在人类各个领域展现出了优异的表现,然而这是建立在大规模的数据收集与数据标注的前提下,数据标注非常昂贵,为了减少成本,需要用到迁移学习。在缺少标注的情况下,利用有标注的相近数据集进行知识的获取,并将获得的知道迁移到无标签的相关数据集,以达到知识复用的目的。将源域的知识应用于目标域,这在迁移学习中被称为领域自适应,是迁移学习中的核心问题也是本文关注的重点问题。本文利用生成对抗网络
知识图谱应用广泛,不仅是许多NLP(Natural Language Processing,自然语言处理)子任务的上游任务,还是推荐系统、问答系统中的重要组成部分。但主要来源于各类百科的结构化图谱存在大量缺失的关系,而经过关系抽取的图谱存在许多错误元组,这些问题影响了图谱应用系统的正确性。为解决以上问题,知识图谱推理(Knowledge Graph Reasoning,KGR)算法可用于对不完整的
在人工智能、5G技术高度发展的今天,室内定位技术越来越成为人们生活、工业生产、智慧城市建设、安防领域的刚需,起着举足轻重的作用。当下各类室内定位技术百花齐放,例如,基于无线通信、惯导、激光雷达、视觉等的室内定位技术。但室内定位并没有像室外定位技术一样形成统一化、标准化。传统的基于纯惯导定位系统可不依赖部署设备实现自主定位,但惯性器件的固有漂移导致定位结果存在有累积误差。地图匹配数据融合算法通过地图