复杂场景下车载视觉实时多目标联合感知方法

来源 :清华大学 | 被引量 : 0次 | 上传用户:kick666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全面准确的环境感知是智能车辆实现自主驾驶的基础。智能车辆环境感知算法大多针对单一任务或单一目标,无法适应车辆、行人和自行车等交通参与者同时存在的复杂行驶环境下的感知需求,而现有的多任务或多目标环境感知算法的准确性和实时性往往难以平衡。为此,本文建立了自动驾驶场景中常见动态障碍物目标和静态道路的统一感知架构,提出了基于车载单目视觉的实时多目标联合感知框架,设计共用特征提取器及多个子任务分支的卷积神经网络结构,同时完成二维目标检测、目标三维信息估计和道路分割三个子任务的实时在线推理,最终实现车辆、行人和骑车人目标的三维检测和道路分割。首先,设计多任务联合感知框架的卷积神经网络结构,以全卷积神经网络为共用特征提取器用于实现二维图像特征的编码,同时构建多个独立的解码分支用于各个子任务的预测输出。其次,为实现快速二维目标检测,多个方面改进现有单阶段目标检测方法。针对行人和骑车人类别容易相互误检的问题,提出了层级分类策略;针对目标相互遮挡的问题,采用软性非极大值抑制后处理算法。再次,为了实现目标的三维重建,设计多项三维信息估计方法,以获取目标的三维位置、姿态及尺寸。提出基于空间递增离散划分的有序回归和补偿项回归来实现目标三维包围框中心的纵向距离估计的方法;设计通过估计目标三维中心在二维图像上的投影位置,进而借助目标中心纵向距离和相机标定参数来确定目标的横向位置的方法;提出一种通过回归目标观测朝向角来间接获取目标航向角的方法;设计通过估计目标尺寸和数据集离线统计尺寸的偏差来获取目标的真实三维尺寸的方法。最后,为实现准确的道路分割,提出基于边缘优化和道路几何形状变形数据增强的道路分割方法。为验证本文提出的车载视觉实时多目标联合感知方法的有效性,在KITTI数据集进行多项评估。实验结果表明,本文提出的联合感知框架能在完成多项感知子任务,输出多种类型目标的检测或分割结果的同时,达到国际领先的精度,多项评估指标在KITTI数据集公开排行榜上名列前茅或排名第一;并且,在GPU硬件平台上,采用1242×375像素大小的图像输入时,单张图像的平均处理时间在65毫秒左右,表明该方法具有实时感知的能力。
其他文献
摘要:煤化学是研究煤的生成、组成、结构、性质、分类以及它们之间相互关系的学科,教学内容具有理论性强、现场应用性强的特点。传统的填鸭式教学方法,难以充分调动学生的积极性,达不到预期的教学效果。教学是一个实时的动态过程,作为参与主体之一的学生在此过程中的众多心理活动都遵循教学心理学的客观规律。本文从教育心理学原理出发,试图运用一些教育心理学的理论和知识,探索在煤化学教学过程中提高学生主体的学习效率和教
中学历史教学有三大任务,即传授知识、培养智力、实施德育.德育是历史教学最重要的目的之一,课堂教学也是对中学生开展德育最经常、最有效的形式.加强和改进课堂德育对实施高
一种地矛螺旋片冷冲压模具,包括上模和下模。所述上模和下模相配合,其配合的工作面为一边开豁口的螺旋状环形平面,所述下模上安设有导向柱,上模上设有与该导向柱相配合的导向孔。
一、学生的发展是创建物理高效课堂的理论基础《物理课程标准》指出:物理教学不仅仅单纯讲授物理学本身的内容和结构,还要以其为载体,着眼于学生的发展.通过学习,使学生获得
期刊
作者曾报道,绵羊妊娠早、中期切除胎羊甲状腺,复制出类似于克汀病的动物模型。本文在胚胎第131~143切甲,出生时的发育情况与对照组已无显著差异。因此这时已不是甲状腺素对脑发育的临界
不同的社会角色会导致人们从众心理活动上的差异。以小学五年级学生为被试,探讨了儿童情境视角下从众行为的情境效应、角色效应和众人行为一致性程度效应。
行人检测是机器视觉研究的热点和难点。随着第四次工业革命的到来,人类生产生活方式也发生了巨大的变化,行人检测在自动驾驶、智能物流、智能监控等领域得到广泛地应用。针对
本文应用脱钙骨基质诱导软骨形成的模型,观察了饮水中不同浓度氟(0,50、150mg/L)对诱导软骨形成及其钙化的影响。结果显示,诱导软骨分化的时间,软骨细胞的形态、以及基质爱尔
调查发现,民族地区大学新生掌握的词汇量与其综合语言能力有较大差异,词汇运用能力与综合语言能力有较大的相关性.大学英语教学应该重视词汇教学,探索高效的词汇教学方法.
基于粤港澳大湾区极点带动、轴带支撑、网络化空间发展布局的背景,结合新型城镇化的理论,反思景区型近域空间新型城镇化发展面临的现实问题,结合市场、政府分别导向下近域空