基于级联神经网络的实时目标检测

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:duyyy12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机视觉和深度学习相关技术的飞速发展,许多精确的二维检测算法相继被提出。然而,仅有二维检测框或分割掩码并不能完全满足实际应用中的需求。在一些实际场景中,特别是在自动驾驶,机器人应用,AR/VR等领域,三维检测任务能够更好地发挥作用。由于激光雷达能够提供精确的深度信息,许多三维检测方法使用雷达点云作为它们的输入数据。相对地,一些方法利用图像数据替换雷达数据作为算法的输入。由于雷达设备具有价格昂贵,不易携带等特点,此类算法很难广泛应用在轻量级的任务上。同时,借助于单目/双目深度估计领域的突破性进展,我们可以利用彩色图片数据获取深度,从而令利用图像数据进行高进度的三维检测任务成为了可能。据此,本文提出了一种面向室外场景的三维检测框架。具体来说,不同于之前直接依赖于彩色图像的方法,本文的方法在重建的三维空间中进行三维检测。本文利用一个数据转换模块将彩色图像数据转换为三维点云,然后利用面向点云的深度学习技术来处理这个问题。为了增强生成点云数据的信息量,本文还提出了一个多模态数据融合模块在点云数据中嵌入RGB特征,从而提升模型的性能和鲁棒性。本文强调除了数据精确性以外,数据表达形式也是影响三维检测性能的一个重要因素。本文在KITTI数据集上验证了所提出的算法,检测结果证明了本文提出的算法的有效性。具体地,我们的算法超过了现存的所有的基于图像的三维检测算法的检测精度。对比之前最好的基于单目图像的三维检测算法,本文提出的算法在IoU阈值为0.7的条件下,在对车辆类别的物体的检测性能获得了15%的mAP的绝对提升。
其他文献
【案情】张某在KTV唱歌期间,因琐事与封某发生口角,二人约定在KTV门口解决。张某将此事告知同伴陈某,并与陈某在KTV门口等候封某到来。期间,封某电话联系张某将见面地点改至某中
报纸
目的:探讨外周血中性粒细胞/淋巴细胞比值(neutrophil-to-lymphocyte ratio,NLR)、血小板/淋巴细胞比值(platelet-to-lymphocyte ratio,PLR)、血清降钙素原(procalcitonin,PCT)在慢性肾脏病(chronic kidney disease,CKD)5期患者合并细菌感染中的诊断价值。方法:行回顾性分析,收集与整理2017年10
<正>5废气后处理技术柴油机燃烧后排放的污染物主要是NO_x和PM。尽管采用了缸内燃烧技术、进气控制技术及电控喷油技术来降低原始排放,还是不能满足日益严格的法规要求。2019
教师资格考试“国考”背景下高中化学教师教学能力现状的研究有助于了解当前化学教师的教学现状及探究教师影响教学能力的因素,从而可以在教学能力的角度为教师资格考试形式
随着住房制度改革的推进和城市化进程的加快,我国房地产业在近几年得到了快速发展,但由于近几年房地产开发投资所占的比重逐步加大,特别是各大城市的商品房价格快速普遍的上
目的分析参松养心胶囊联合美托洛尔治疗冠心病伴室性心律失常的效果。方法将100例冠心病伴室性心律失常患者根据随机数表法分为对照组与观察组,各50例。全部患者均接受基础治
<正>"说课"通常是指教师用口头语言表述具体课题的教学设想及其理论依据。最常见的"说课"形式,是授课教师面对同行或教研人员,在备课的基础上,讲述自己的教学设计,然后由听者
高速公路中的隧道在节约人们出行时间的同时也增加了驾驶的危险性,当隧道内的照明不充分时,由于隧道内外的高亮度差容易引发“黑洞效应”和“白洞效应”,使驾驶员无法判断前
目的:观察冻伤创面在MEBT/MEBO作用下的演变过程,探讨MEBT/MEBO在冻伤治疗过程中的作用。方法:首先行快速复温,显露冻伤创面,常规外涂MEBO暴露治疗,6h换药一次,3周后坏死组织
精神障碍的早期发现、早期评估目前受到较为广泛的关注,选择一个内容全面、完全标准化、高度定式化的评估精神障碍的检查诊断工具至关重要,本文就复合性国际诊断问卷(CIDI)的