基于深度学习的车辆和行人检测算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xinyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汽车制造业和信息科学技术的发展使无人驾驶的落地成为可能,目前世界上很多知名汽车企业已经在无人驾驶上进行了战略布局,近几年无人驾驶技术已经开始实验性落地。环境感知系统是无人驾驶系统中的重要组成部分,它为后续驾驶行为决策提供了判断依据,图像目标检测是感知系统中重要技术之一。近几年基于深度学习的目标检测技术成了研究热门,性能出色的新算法不断涌现,逐步取代传统的检测算法,在实际应用中被广泛采用。基于深度学习的车辆和行人检测算法按实现方法主要分为两阶段算法和单阶段算法。以R-CNN算法为代表的两阶段算法先对图像提取候选区域,然后进行定位和分类得到检测结果,两阶段检测算法在检测精度上表现出色,但在检测速度上不太理想,不适合应用于无人驾驶系统中做实时检测任务。以YOLO算法为代表的单阶段算法直接采用一步端到端的方式得到检测结果,相比于两阶段检测算法,单阶段算法流程简单,在检测速度上有明显优势,能够在保证精度的前提下兼顾实时性,因此在实际应用中被广泛采用。本文主要研究基于单阶段目标检测算法YOLOv3的车辆和行人检测,为了应对YOLOv3网络模型复杂,计算开销大,以及交通道路场景中环境复杂增加检测难度等问题,本文提出了三个改进策略来优化基于YOLOv3的车辆和行人检测算法。(1)针对卷积神经网络模型参数量庞大,运行时计算开销大和占用内存大等问题,提出了基于YOLOv3的轻量化车辆和行人检测模型。通过在YOLOv3的损失函数中添加批标准化层缩放系数的L1正则化,进行稀疏化训练,然后对缩放系数过小的通道和残差模块进行裁剪,得到精简模型,从而极大地压缩模型参数,减少计算量,提高检测速度。(2)由于交通道路环境中存在严重的遮挡会导致漏检问题,在网络的后处理阶段,本文在改进Soft-NMS的基础上提出了Merge Soft-NMS算法,取代标准的非极大值抑制NMS算法,Merge Soft-NMS对非最佳检测框的置信度进行衰减而非直接抑制,减轻了NMS抑制相邻检测框造成的漏检问题,并对同一目标多个重叠度较高的检测框按置信度权值合并,提高了定位的准确性,且该改进可以直接替换,不需要重新训练网络,操作上易于实现。(3)YOLOv3中的先验框通过K-means聚类算法从多类别数据集中提取得到,不适合运用到车辆和行人类别检测上,为了避免先验框不合适增加定位难度和K-means聚类算法随机选取初始点的不稳定性,本文采用K-means++算法在无人驾驶数据集上的提取先验框。为了验证本文算法的有效性,在实验中使用了自动驾驶目标检测数据集对其训练和测试,本文算法在保证检测精度的前提下,在检测速度、模型大小和计算量上具有显著的优势。
其他文献
随着神经网络的广泛应用,其缺点愈发被发现。由于会产生“灾难性遗忘问题”而无法进行增量学习。近些年来,迁移学习的相关领域发展迅速。迁移学习方法大都注重模型在新任务上的效果,而在过去任务上的效果往往不注重。作为一种特殊的迁移学习方法,增量学习主要任务就是解决“灾难性遗忘问题”。本文将从另一个角度对灾难性遗忘进行解释:神经网络的训练对其数据的分布有很高的要求,如果训练数据不符合目标结果的分布情况,网络将
粒子群算法是由J.Kenned和R.C.Eberhart于1995年提出的一种优化算法,它通过模拟动物种群的行为而设计,其目的是获得最优解。这些群体内部各成员之间通过互相协作的方式去寻找食物,并且群体中的每个成员在搜索过程中都积累一定的经验,粒子群算法就是根据这些个体自身的经验和学习其他成员的经验,来不断的改进搜索方向和搜索进度。粒子群算法具有良好的优化性能,使用简单且应用广泛。美中不足的是,粒子
随着互联网技术的不断发展以及人们生活需求的不断增长,智能网联汽车的概念应运而生。与传统汽车相比,智能网联车的功能更加丰富,需要处理的网络数据量的规模也更加庞大。而传统的车载网络的带宽有限,无法处理大量的网络数据。与传统的车载网络相比,车载以太网具备高带宽、高吞吐量、低成本等优势。目前,许多汽车制造商已逐步应用车载以太网来满足高级驾驶辅助系统应用的运行需求。因此,车载以太网在汽车上的应用前景十分广阔
随着改革开放的脚步不断向前大步迈进深化发展,我国经济发展势头日新月异、迅猛提升,经济的发展紧密了世界各国间的联系,中国逐渐从一个发展中国家向发达国家迈进,物质的供给与物质的储备得到了极大提升,与此同时精神需求日益上涨,文化领域得到了空前的发展,其中电影领域的发展尤为瞩目。中国电影从以往为艺术类电影创作模式转向市场经济化运作模式,发展势头强劲,电影市场的蓬勃发展一方面得益于国家相关部门大力扶持,另一
由于二十一世纪网络的发展与信息量的剧增,各类数据间的关系变得越来越复杂,人们也不得不与大量的数据打交道。因此,当前的世界已经进入了大数据时代。为了能够在杂乱无章的数据海洋中高效的检索和整理出人们所需要的信息,就要对大量的数据进行批量分析和聚类,然后实现对这些不同类型数据的量化处理,并使用某种固定规格的数组或者向量来表示它们,这种表示将会满足后期应用中对数据的统计,检索,推荐以及分类等需求。对这些数
近年来,人们越发看重节能环保,而且随着我国居民汽车保有量的不断提升,国家也出台了一系列政策来对汽车能耗与排放提出了更高的要求。轻量化设计能够有效地实现满足汽车性能要求的同时减少能耗与排放,在实现汽车轻量化的途径中,材料替换是十分有效的方式。钢板弹簧的重量占商用汽车非簧载质量的10%-20%,使用复合材料来将其全部或部分进行替换,一般能够实现至少50%的减重,同时可以进一步改善汽车的行驶性能、减少燃
深度学习在语言翻译,图片识别等领域大力发展,已经在生活中获得大量应用,如机器翻译、人脸识别等。随着5G时代的到来,网速对人的限制越来越小,以及人们产生和发布视频资源的便捷性,都促使视频资源在网络中海量增长。如何利用深度学习算法学习视频信息表达方式和进行网络短视频多模态搜索一直是业界关注的研究领域。与手工制作的动作特征不同,深度学习方法在主动学习图像特征方面表现良好,这为人类动作识别技术提供了一个新
深度神经网络在图像分类任务中取得了不俗的表现,在生产生活场景中有着普遍应用。然而,对抗学习的出现对深度学习模型应用的鲁棒性提出了挑战。对抗学习包括对抗攻击和对抗防御,对抗攻击旨在挖掘人与机器学习模型认知事物的差异,对于图像分类任务来说,即是探索分类模型的决策边界。对抗攻击算法利用这种差异基于干净样本添加对抗扰动构建对抗样本,能够诱导机器学习模型预测错误的结果。由于对抗扰动很微小,人类无法察觉对抗样
随着我国经济金融的高速发展,国内的电子商务迈入迅猛发展的时代,与此同时,物流快递业取得了空前的发展。然而,不断发展的物流行业也给物流的配送方式带来了巨大挑战。设置物流快递代收点是目前族类主要的配送形式之一,尤其是在以年轻人为主体的各大高校。但是,现今的的快递代收点不但种类多、分布散乱,而且要求定点取件过期不候。包裹损坏、快件丢失、个人信息泄露等问题也是经常发生,导致用户对快递末端配送服务的满意度极
5G网络技术和智能设备的飞速发展催生了越来越多高级应用的出现,这些新兴的应用服务往往具有计算密集和延迟敏感等特点,这给计算能力有限的用户设备带来了很大的挑战。计算卸载是解决该挑战的有效方法之一。传统的移动云计算模式是集中式的处理方案,将计算任务卸载至位于网络中心的MCC云服务器上执行,其缺点在于MCC云服务器通常距离用户较远,网络传输延迟大,无法满足应用服务的低延迟要求。移动边缘计算模式允许用户设