面向无人驾驶的基于卷积神经网络的行人检测与跟踪

来源 :天津大学 | 被引量 : 0次 | 上传用户:hongfengye365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人驾驶车辆是当前社会研究的热点方向之一,也是未来交通的发展趋势。在无人驾驶视觉感知中,行人检测与跟踪是其极为重要的组成部分,具有广泛的研究意义和应用价值。现在很多国内外高校、科研机构和公司已经在这方面取得了显著的研究成果,尽管如此,由于无人驾驶场景环境背景复杂以及行人固有的特性,行人检测与跟踪仍然有很多问题需要进一步研究。首先,针对无人驾驶车辆对于行人检测鲁棒实时的应用需求,提出一种基于改进SSD的实时行人检测算法。传统的行人检测算法鲁棒性较低,检测速率慢。因此,该算法采用检测速度较快的基于卷积神经网络的一阶段目标检测方法SSD模型。为了在满足实时性条件下,提高算法对目标特征的提取能力,提出将易于收敛、模型复杂度低的深度残差网络作为SSD模型中的基础骨干网络。在Caltech行人数据集测试的实验结果表明该算法具有更优的检测性能,满足无人驾驶场景对行人检测的基本要求。其次,针对无人驾驶环境背景复杂,行人的尺度变化和外观差异较大等问题,提出将语义分割特征聚集到基于一阶段的多尺度目标检测方法中,增强对行人特征的提取能力。同时,在不增加额外输入的情况下,提出了一种多通道特征联合学习的网络结构。在多个行人数据集上的检测结果表明了所提出的融合算法显著地提升了行人检测的精度,同时具有较高的检测速率。最后,针对行人检测算法无法提供行人足够的运动信息,以及传统的在线跟踪算法没有充分地利用行人的特征信息等问题,提出一种基于融合光流的Deep SORT行人跟踪算法。为了充分利用行人的特征信息,在卡尔曼滤波的线性预测部分融合基于光流的目标运动信息。同时,为了使算法满足实时性要求,将改进SSD的实时行人检测算法应用于Deep SORT模型中的行人检测部分。在校园采集的数据集上的测试结果表明了该算法的有效性。最后,将行人检测和跟踪的结果通过逆透视映射到车体坐标系下,为决策和规划层提供直接可用的数据。
其他文献
气液两相流广泛存在石油工业、核能工程及热能工程等工业生产过程中。为实现工业生产过程优化,准确识别和掌握气液两相流流动特征是非常必要的。相比于单相流,气液两相流流动更具有多样性、随机性、不稳定性以及复杂性等特征,流体流型复杂多样。这些不稳定因素,给准确测量气液两相流持气率带来巨大挑战。准确预测气液两相流持气率,对油气田生产过程中油井动态监测及传感测量系统设计具有重要实际意义。针对差压传感器稳定性强、
随着多媒体信息技术的快速发展,数字图像成为多媒体信息的重要载体之一。由于数字图像具有现场性、直观性等良好的特性而得到广泛使用。目前,各种图像处理软件的开发和应用使用户不必掌握相关专业知识就可以方便、快捷地对数字图像进行编辑操作,以满足自己的工作需要或者日常娱乐。但如果被恶意篡改者非法利用在军事、法庭证据、新闻等领域,将会给社会带来一定扰乱,“眼见为实”的传统观念也正在被打破。所以,迫切需要一种取证
随着汽车产业的快速发展,车内空气污染成为公众关注的热点问题。在影响车内空气质量的诸多因素中,内饰材料是主要污染源。目前用于汽车内饰材料的检测方法存在操作复杂、成本高等缺点,因此开发一套能够快速、准确检测汽车内饰材料的系统对从源头减少车内空气污染具有重要的理论意义和应用价值。本文以汽车内饰材料检测为应用背景,对QCM(Quartz Crystal Microbalance,石英晶体微天平)气体传感器
本文针对具有高度非线性、强耦合性和参数不确定性的多自由度机械臂系统,研究其轨迹跟踪控制问题。首先对Denso VP6242机械臂的数学模型进行分析:采用标准D-H方法建立机械臂的正运动学模型,采用代数法建立机械臂的逆运动学模型,并将由逆运动学模型反解出的关节角度带入到正运动学模型,仿真数据表明逆运动学模型的精度可达10-16;根据拉格朗日方程建立机械臂的动力学模型,为后续控制方法的仿真验证提供控制
在脑仿真与类脑计算领域,神经系统对于运动功能的调控,一直为人们所关注。大量生理实验表明,中枢模式发生器(CPG)在人类的节律运动过程中,起着至关重要的作用,同时,小脑与人类运动功能协调以及学习记忆有密切联系。此外,近年来受脑认知与信息处理机制启发的类脑计算平台,已成为人工智能领域的研究重点。类脑计算的效果,很大程度上依赖于硬件平台的性能,具有并行运算能力,且能灵活配置的现场可编程门阵列(FPGA)
脑电(EEG)信号作为识别人体生理状态的最可靠的度量之一,被国内外研究人员广泛应用。深度学习技术为挖掘脑电信号中的信息提供了新的技术手段,但在此过程中面临着结构设计困难和输入信噪比低的问题。本文采用群智能算法和强化学习框架以实现模型结构优化,利用递归网络进行数据输入优化,实现在情绪辨识和疲劳驾驶检测任务上的深度学习模型的动态优化设计。本文首先基于情绪辨识任务的EEG数据研究在卷积神经网络(CNN)
烟雾识别对于火灾的早期探测及火灾危害的降低具有重要的意义。目前基于计算机视觉的烟雾探测手段存在误报较多,准确率偏低,使用深度网络则模型过于庞大等问题,为解决此类问题,本文提出烟雾图片块递增判定算法,并搭建轻量级深度神经网络模型对烟雾进行识别。本文首先通过网络途径收集烟雾图片,依靠天津消防研究所搜集火灾烟雾视频,精选截取后使用数据增强方式扩充图片数量,建立了烟雾数据集,包含烟雾图片和非烟雾图片各12
据世界卫生组织统计数据显示,我国一直处于交通事故高发生率国家之列,而疲劳驾驶是造成交通事故的主要原因之一。近年来,脑电图(Electroencephalogram,EEG)信号分析在疲劳驾驶研究中得到了广泛的关注。本文进行了模拟驾驶实验,并针对采集的脑电图信号进行分类和回归研究。在疲劳驾驶分类研究中,针对脑电信号在较短的时间内产生大量的空间定向数据,本文提出了一种基于加权主成分分析(Weighte
气液两相流广泛存在于石油开采、核反应堆、化工、冶金等工业领域生产过程中。持气率是反映气液两相流动态行为的重要参数,持气率与流型、流速、流动方向等密切相关,是建立气液两相流流动模型的重要流动参数。超声传感器广泛应用于多相流持气率检测技术,其中,探究气液两相流超声传感器持气率理论模型具有重要学术价值及实际应用意义。本文建立了不同泡径尺寸下气液两相流泡状流持气率理论预测模型。首先,采用流体取样器获取气液
两相流广泛存在于工业生产领域,研究两相流的流动形态及运动规律,对国民经济与国防科技的发展具有重要意义。Wire-Mesh传感器是一种侵入式传感器,能够直接测量流体的局部电导率并转换为局部相含率,被广泛应用于定量刻画流体的流动结构。近年来,深度学习在图像领域得到了广泛应用,人们借鉴其在图像分类及图像分割等任务中的成功经验,提出了基于深度学习的图像超分辨率重建方法。该方法与传统方法相比,能够还原出更多