基于深度学习的车辆行人目标检测算法研究

来源 :长春大学 | 被引量 : 0次 | 上传用户：huanghoubin101

【摘要】

：

【作者】

：

闫登豪

【机构】

：

长春大学

【出处】

：

长春大学

【发表日期】

：

2021年01期

【关键词】

：

车辆行人检测深度学习图像融合 MobileNetV2网络多尺度预测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着科技发展和民众财富增加,车辆日益增多的同时也造成了频发的交通事故,给人民生命和财产安全造成了严重危害。因此,开发汽车智能辅助驾驶技术和无人驾驶技术成了重要研究方向,其中基于可见光和红外图像的深度学习目标检测技术研究具有重大价值,由于车辆行人目标的多样化,道路环境的复杂使得车辆和行人检测技术非常具有挑战性。本文对车辆行人目标的检测进行了比较系统的分析和研究,提出了基于红外和可见光图像融合的检测框架,主要工作如下:（1）研究了深度学习的基本要素,对深度学习网络模型涉及到的重要性能指标进行了分析,在数据集上选择FLIR、BDD100K和KAIST多光谱数据集作为原始数据集,并进行分析和整理。（2）本文提出了基于轻量级MobileNetV2网络的图像融合方法,先将MobileNetV2模型中可见光图像细节部分与红外图像细节部分的1、3、10、16和18这五层通过最大值融合成新的细节部分,然后将使用权重相加方法融合的可见光基础部分与融合后的细节部分重建成新图像,最后与其它方法进行主客观比较,并计算融合图像的FMIdct、FMIw、SSIMa和Nabf值,分别为0.436、0.445、0.792、和0.001,均优于其他方法融合的结果。（3）在分析one-stage检测算法基础上,提出了改进YOLOv5多尺度预测网络来检测图像中的目标,使网络获得了更大的尺度预测范围和更高的m AP（m AP@0.5和m AP@0.5:0.95分别高出0.07和0.06）,同时网络模型的精准率、召回率和推理速度比原网络分别优化0.06、0.04和51FPS。（4）对FLIR、BDD100K和KAIST多光谱数据集中的红外、可见光、混合和融合数据集分别进行实验,实验结果表明融合数据集训练生成的模型比混合数据集训练生成模型的精准率、召回率和m AP值高,混合数据集训练生成的模型优于可见光和红外数据集训练生成的模型。本论文先使用轻量级MobileNetV2网络的图像融合方法对红外图像和可见光图像进行融合,然后对融合图像进行车辆和行人信息的检测,预测出融合图像中目标的类别、位置和概率,以此解决复杂情况下的车辆行人的检测问题。

其他文献

基于FPGA和CAN协议2.0B的总线控制器研究与设计

CAN总线是自动化系统整体水平的基础技术,对我国科技发展以及国民经济有着重大影响,随着CAN总线的发展和相关协议日益成熟,由国外研究机构和芯片制造商研究开发的CAN总线控制器相继问世。我国相应的研究设计工作近年来才逐步开展。目前国内对于CAN总线控制器芯片研究尚处于起步阶段,通过国外的芯片研究其核心技术,在此技术上进行创新和改进,对于推动我国现有芯片技术和CAN总线通信在我国的发展具有一定作用,同

学位

CAN总线控制器设计自顶向下设计可编程逻辑阵列

关于核心素养下小学语文情境教学的研究

当前阶段,小学语文课堂教学各项工作已经越来越受到教育界乃至全社会的广泛关注和重视。情境教学法这种先进的教学理念与教学模式运用于语文课堂教学各个环节中,不但能够激发学生们的语文学习兴趣,而且能够有效培养小学生们语文学科核心素养。鉴于此,笔者在本文针对核心素养视域下的小学语文情境教学进行一定的分析和探究,并且提出一些合理化的教学建议,以供参考。

期刊

核心素养小学语文情境教学有效策略

基于Leap Motion的手功能康复训练评估系统关键技术的研究

在虚拟现实技术日新月异的今天,人们对人机交互的要求也越来越高,总是希望以更直接、更自然、更逼真的方式来实现,特别是在通过手势进行人机交互的场景下。因此,对于人机交互中的手势识别的探索和完善具有相当重要的意义。当代,由于脑卒中引发的手功能障碍患者日渐增多,基于现有的手功能康复设备以机械设备为主,机械设备不仅会加重患者手的负担,而且缺少必要的沉浸式体验,不能对康复过程进行跟踪评估等问题。因此,本文提出

学位

Leap Motion沉浸式SVMKNNPCAAHP

基于主动学习抽样策略的消化道图像分类方法研究

基于深度学习的无线胶囊内镜消化道图像辅助诊断,在近年来取得了显著成果。诊断过程中往往需要针对特定的消化道器官进行筛选和分析,并且单个患者的消化道数据集是非常庞大的。因此训练一个有效的模型用于对消化道器官进行自动分类,将极大地减轻诊断的工作量和提升诊断效率。在实际应用中,有监督学习技术容易取得较高的精度,仍占据着主要地位。但有监督学习需要足够多的标注数据进行模型训练,而收集和标注足够的消化道图像代价

学位

胶囊内镜消化器官分类深度学习主动学习

人眼视线估计方法研究

传统方法进行人眼视线估计时,由于复杂的硬件系统环境会导致人眼视线估计的结果出现较大误差。为了减小误差,本文简化硬件系统,只利用一个网络摄像头采集图像,并以深度学习理论为基础,在人脸关键点信息获取的基础之上,提出一种以人眼瞳孔定位与头部姿态估计相结合的方法,来提升人眼视线估计的精度。本文主要在以下几个方面展开了研究:（1）对人眼视线估计所需的人脸检测算法,人眼定位算法,头部姿态估计算法等进行深入研究

学位

视线估计人脸检测人眼特征瞳孔定位头部姿态深度学习

新课改背景下小学语文情境教学策略探究

语文是我们学习其他学科的基础性学科,只有先学好了语文,其他学科的学习才会水到渠成。但是,我们发现,学生对语文学科学习的兴趣始终不浓厚,总是感到枯燥乏味[1]。究其原因,大都囿于传统教学方法的呆板无趣,如何突破传统,落实学生主动学习、自觉学习的新理念,情境教学法就为此问题的解决提供了有效的途径。

期刊

缸内直喷汽油机轨压控制算法研究

随着汽车保有量的增加,汽车在给人们带来方便之时,也带来了能源危机和环境污染两大问题。面对日益加剧的环境污染和能源危机问题,缸内直喷（GDI）发动机凭借着其低排放性和优异的动力性应运而生。由于GDI发动机的高压泵和喷油器均与共轨管道相连,且高压泵泵油波动大、发动机工作周期频率高,导致GDI发动机轨压波动大不易控制。而GDI发动机轨压直接影响着喷油压力,如轨压波动大会导致喷油压力的不稳定,会降低GDI

学位

轨压控制模糊PI反步滑模自抗扰控制GDI发动机

基于QKD的量子密码云平台研究

量子保密通信是基于量子力学的原理通过量子密钥分发（QKD）系统来进行保密通信,量子密钥分发是一个通信双方基于QKD协议协商产生共享密码的过程,所产生的密码在理论上具有无条件安全的特点。量子保密通信技术的研究是量子力学与信息科学相结合产生的新兴交叉学科的一个重点发展方向。通过使用量子保密通信技术实现信息的安全应用正逐步呈现出需求牵引、政策驱动、快速发展的特点。当前量子保密通信技术逐步走出实验室,并发

学位

密码云服务量子密钥分发成码率误码率随机性

情绪生理数据的获取与数据库管理平台的建立

近年来,基于多生理信号的情绪识别技术已经逐渐成熟,对情绪生理数据的要求也逐渐提高,由于生理信号属于微弱的生物低频电信号,因此在采集与存放的过程中极易受到各种噪声的干扰,为了得到标准的情绪生理数据以及更好的对情绪生理数据进行保存与处理,本文研究了情绪生理数据的获取与预处理方法,并搭建了一个情绪生理数据库管理平台。本文的主要研究内容如下:1.情绪生理数据的预处理方法研究:通过分析心电、皮电和呼吸3种生

学位

生理数据情绪数据库管理平台

基于模糊控制算法的无人机避障方法研究

过去的几年中,随着移动终端的飞速发展,相关的产业链,例如微控制器、惯性传感器、通信芯片等已经发展成熟。无人机凭借其机动灵活的特点已从原本的战斗、巡逻、侦查等领域延伸至诸多工业及民用场景。随着无人机应用行业的日益普及,自然的导航环境变得越来越复杂,如何确保无人机的安全,成功完成工作目标以及如何防止无人机撞机或交通事故安全事故的发生,无人驾驶飞机的避障变得越来越重要,已成为无人机研究的热点。本文研究以

学位

无人机避障避障算法模糊控制

基于深度学习的车辆行人目标检测算法研究

与本文相关的学术论文