面向复杂交通场景的行人检测及其跟踪

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:JK0803_lijixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶技术是提高交通运行效率、降低事故发生率、增强辅助驾驶智能化体验的重要手段。随着硬件运算能力的不断提升,以及低成本的环境状态采集设备的迭代更新,自动驾驶相关课题在近年来引发了科研人员的广泛关注和深入研究。自动驾驶系统通常由环境感知、路径规划和决策控制三部分构成,而实现对复杂交通场景状态的准确感知是系统稳定运行的基础和前提。由于基于机器视觉的环境感知技术具有适用范围广、安装部署便利、算法成熟度高、硬件价格相对低廉等方面的优势,使其逐渐成为了目前主要的研究方向之一。本文关注于自动驾驶环境感知任务中的行人检测、单目标跟踪和多目标跟踪课题,通过探究、改进现阶段相关算法中存在的问题与不足,实现对复杂交通场景下行人的有效检测和运行轨迹估计,进而及时预警并避免事故的发生。所涉及的主要工作如下:(1)为了解决基于部件的行人检测仅利用子模型与主模型之间的空间先验对人体结构进行编码,缺乏对部件之间关联属性进行有效描述的问题,建立了基于人体树图模型的行人检测框架。首先,定义人体各部件之间的父子关系,通过对父子部件对所属类型进行聚类,获取训练样本的隐藏变量。其次,为了兼顾类内紧密性和类间分离性,基于均方误差和戴维森堡丁指数构建包含两阶段适应度函数的混合粒子群聚类(Hybrid Particle Swarm Clustering,HPSC)算法,解决K-means对初始聚类中心敏感,且聚类中心数量依据主观经验而定的缺陷。最后,在检测阶段利用离线训练模型,结合动态规划算法求解状态转移方程生成行人检测结果。在基准数据集上的测试结果证明了所提改进策略的有效性,以及整体行人检测算法的准确性与鲁棒性。(2)针对复杂交通场景下YOLO-V4算法在应对行人密集遮挡方面存在的性能局限,通过优化网络结构,并设计有效的多尺度特征融合策略和网络损失函数,构建了改进的YOLO-V4行人检测框架(Improved YOLO-V4,Im-YOLOV4)。首先,根据行人检测对象将算法设定为单一网络输出,并利用所提阶梯融合策略整合来自多种尺度的图像信息,在保证锚点的宽高比估计依然由数据驱动的情况下,有效解决原始网络对于近似目标的无效锚点分配问题。其次,调整输出特征图与网络输入图像的分辨率比率,以减少训练样本的标签重写案例。最后,引入排斥力的概念对边界框回归损失函数进行优化,进一步改善模型对于密集遮挡行人的检测鲁棒性。实验结果表明,Im-YOLOV4能够显著提高原始算法的行人检测性能,且在自动驾驶领域应用具有更高的鲁棒性。(3)为了提升基于孪生网络的单目标跟踪算法在复杂交通场景下的行人跟踪性能,提出了一种包含多阶段的单目标跟踪框架D-CRPN(Siamese Tracking with Deeper Networks and Cascaded Region Proposal Network,D-CRPN)。首先,通过内部裁剪操作对残差模块进行重构,并利用其搭建骨干网络,以从模型结构本身解决填充操作对于网络平移不变性的破坏。其次,为了有效整合具有强互补性的深层语义和浅层空间信息,为不同阶段网络设计了特定的特征传输模块(Feature Transfer Block,FTB),并对整体网络的RPN输出进行决策级融合,进一步提升模型的跟踪性能。最后,针对RPN模块的输出响应图提出了一种质量度量方法,并将其应用于决策级融合时自适应权重的计算。实验结果表明,所提D-CRPN在采用更深主干网络的情况下,能够有效利用网络不同阶段输出信息的互补性,切实提高算法的目标跟踪准确率。(4)针对实际交通场景下的人员多目标跟踪需求,结合所提Im-YOLOV4行人检测器和D-CRPN单目标跟踪器,提出了一种基于时空线索融合与优化级联匹配的多目标跟踪框架。首先,利用运动模型和外观模型设计了可靠的在线多目标跟踪算法流程。其次,在时空线索融合阶段,通过跟踪质量评价实现对候选结果的扩充,并考虑遮挡因素制定了适应的单目标跟踪器停止更新条件;在长期线索提取阶段,提出了轨迹历史外观筛选策略和轨迹评分机制,以提升长期线索质量并对级联匹配优先级次序进行优化。最后,通过运动估计和运动补偿消除相机抖动对于运动信息约束有效性的影响,并利用外观及运动匹配和数据关联算法完成多目标跟踪任务。在MOT Challenge 16和MOT Challenge 17数据集上的测试结果表明,所提方法通过融合视频长短期线索实现了对真实场景下行人的鲁棒多目标跟踪。
其他文献
茶文化是中华传统文化瑰宝之一,蕴含丰富的文化资源与德育价值。幼儿教育是我国国民教育的基石,让幼儿传承和弘扬传统文化是势在必行的重要举措。本文依托优秀的茶文化资源,将其融入幼儿园"五大领域"教育活动,实现幼儿形成良好品德的目的。
综放开采放顶煤过程是一个复杂且多干扰的非线性系统,放顶煤需要放煤工人依靠视觉、听觉观察放煤口落煤情况,通过经验积累控制放顶煤支架摆动尾梁和收放插板,实现放煤控制。这种人为控制地判断不及时会导致放煤时间不足或过长,以至于放煤过程中常出现过放或者欠放情况,造成资源回收率低和煤质难以保证,显著削弱了刮板输送机的运输稳定性和效率,且由于顶部煤层及垮落煤量的不均匀性,实现对放煤过程中的后续放煤量进行精确预测
随着我国基建的快速发展,水电工程、高速铁路、油气储运等大型工程越来越多,同时遇到的地灾情况更加复杂,地下工程开挖过程不良地质不能及时探测和治理会对施工造成巨大经济损失,有的甚至造成安全事故。时间域电磁法作为一种技术相对成熟的地球物理探测方法,因其通过采集二次场而对地下低阻体敏感的特性常用于寻找地下水、软岩等。本文针对常规隧道瞬变电磁数据处理精度不足的问题,重点研究了隧道瞬变电磁一维反演方法,从反演
为了更深入的了解天峨本土文化,挖掘先进的具有教育价值的内容作为我园的园本课程来源,本文就《壮族蚂拐舞融入幼儿园大班音乐活动的探究》为主题,探索将蚂拐舞融入大班音乐教育活动的教学模式,为我区幼儿园民族民间舞蹈的开展提供一定的理论依依据和实践模式。
丽江,是全国唯一拥有"文化、自然、记忆"三项世界级遗产的地区,也是中国的魅力城市。丽江古城建于宋末元初,盛于明清,迄今已有800余年历史。古城依山筑城,临水为街,家家流水,户户垂杨,花树掩映,一街一景,皆可入画,纳西风情、东巴文化十分浓郁,被誉为具有"小桥流水人家"的东方山水园林城市和蕴含"清明上河图"般厚重积淀的历史文化名城。在我国现代化教育水平不断提高以及教育改革力度不断深入的带动下,幼儿教育
煤炭开采过程中,带式输送机是运输原煤的主要设备,同时也是耗电的主要设备,启动后常保持恒高速运行,容易出现低载高速、甚至空载高速的“大马拉小车”现象,浪费了大量的电能。根据实时煤量变化调节皮带速度可以有效缓解上述问题,因此,煤量实时准确的检测成为带式输送机节能调速的关键。传统的检测方法受多种因素的影响,检测精度不稳定,且考虑到带式输送机的调速过程并非无级调速,本文提出了一种基于机器视觉和深度学习的煤
穿墙成像雷达通过发射低频电磁波穿透建筑墙体,实现对室内人体目标的实时成像定位,在城市作战、反恐维稳、灾难救援等领域具有重要的应用前景。由于室内环境的复杂性,单雷达穿墙探测存在遮蔽盲区、定位精度低、虚假目标干扰等问题。分布式穿墙成像雷达在多个视角部署多个穿墙成像雷达节点对室内目标进行协同探测,可以弥补单雷达探测的不足,已成为当前国内外研究热点。本文针对室内多目标稳健跟踪问题,开展了分布式穿墙成像雷达
"一方水土养一方人",我们都是苏州人,更是吴文化的传承人。吴文化历史源远流长,是丰富、独特、优秀的地域文化,以无锡和苏州为代表,反映了当地物质文明和精神文明的一切成果和内涵,具有十分丰富的可挖掘价值,将其融入大班主题教育活动中,不仅激发幼儿对于家乡的热爱,而且促进了吴文化地方特色代代相传、不断发展。
乡村生态景观生物多样性是全球生物多样性的重要组成部分,是乡村景观构建、评价和乡村宜居发展的重要保障。以Web of Science中1990—2020年522篇相关文献为研究对象,运用文献计量工具CiteSpace绘制文献共被引和关键词共现网络知识图谱,重点考察转折点、高突现及高被引文献,理清乡村生态景观生物多样性研究的发展脉络、热点与趋势。研究发现:(1)乡村生态景观生物多样性研究的发展可分3阶
本文基于中国与RCEP其他成员国农产品贸易现状,采用中国一般均衡模型(CGE)量化模拟RCEP协定实施对中国农业的影响。结果表明,RCEP协定实施有利于中国以更低的价格保障大宗农产品有效供给和满足国内居民食物消费升级需求,在贸易创造效应的作用下,中国从RCEP国家进口的农产品增加;在贸易转移效应的作用下,中国从世界其他国家进口农产品数量将出现不同程度下降;中国与RCEP国家的农产品贸易具有弱竞争性