自动驾驶场景库数据系统的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:g123s123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,自动驾驶技术飞速发展,但自动驾驶系统目前仍存在较大不稳定性,需要通过海量的驾驶场景库数据来构建虚拟场景,以进行全面严格的测试评价。业内各公司机构受限于数据采集、维护成本较高,缺乏一个提供统一标准数据的自动驾驶数据平台。国汽智能网联汽车研究院为此牵头业内多家公司,设计并实现了自动驾驶场景库数据系统。该系统集成了对采集数据的预处理、存储、标注和统计分析等功能,为相关算法提供训练、测试数据集,为虚拟仿真环境提供测试用例数据。本文主要分析了自动驾驶场景库数据系统的业务需求,阐述了系统数据校验提交、数据标注和数据统计分析三个功能模块的设计和实现。系统基于B/S结构模式,采用前后端分离的开发方式,分层次设计实现。数据校验提交模块负责校验采集数据的格式,对校验通过并提交的采集数据进行预处理,清洗异常值和缺失值,最后将处理后的数据整合存储。该模块基于Spark计算平台执行数据预处理和整合的计算任务,针对不同数据的特性整合FastDFS、ElasticSearch和HBase组件实现数据分布式存储。数据标注模块负责对图像、点云等数据执行目标检测、语义分割等多种标注任务,执行过程采用先算法预标注,再人工修正的方式,以减少标注人力成本。该模块使用TensorFlow Java API读取训练的pb模型,采用策略模式实现为不同算法标注任务提供对应算法预标注的服务。数据统计分析模块负责数据图表分析和语句查询功能。图表分析功能实现时,实时数据部分通过ELK架构收集日志数据处理并展示,非实时数据部分采用HBase存储、ElasticSearch索引和Vue.js框架开发交互界面的方案。语句统计功能基于Spark SQL组件读取Hive中同步的HBase数据来实现。目前,本系统三个模块基本功能均已实现,提供了对自动驾驶数据的清洗、标注、分布式存储和统计分析功能,解决了海量自动驾驶数据处理和维护方面的难题,能够输出规范标准的数据以构建虚拟仿真用例。
其他文献
<正>人类在18世纪发现了儿童,19世纪发现了妇女,20世纪发现了老人,而到了21世纪,养老产业被专家列为最赚钱的"十大行业"之一。作为养老产业中的重要一环——养老地产,也迎来
将接受化疗的 6 0例妇科癌症病人随机分为对照组和观察组 (各 30例 )。对照组单纯应用止吐药 ,观察组采用行为放松疗法与配合止吐药控制恶心呕吐。从第 3疗程开始 ,分别测量
新闻漫画以独特的视角注视着社会的方方面面,以简单的图像记载着历史的重大事件。中央苏区的新闻漫画传播是在第一次的人民政权下展开的,是苏区整体新闻与文化传播的一个重要
当今,提倡科学性、实用性的新农村住宅已受到越来越多人的重视和关注。促进农村经济的可持续发展,重点是在符合农民生活习惯和生活方式的前提下,在住宅设计上突出地域特色、
由于现代光通信技术的发展,各种光网络的建设对光功率分配器提出了很大的市场需求。光功分器的基本功能是可以对光信号进行分路或合路,它是光网络中的核心器件之一,本论文研
俄罗斯是中国最重要的邻国之一,近年来,中俄关系发展迅速,在两国高层领导人的共同努力下,中国与俄罗斯建立了"面向未来的战略合作伙伴关系",为在新世纪中进一步发展两国关系确
中俄先后提出两国东部毗邻地区经济振兴与开发战略,为双方通过互动合作实现振兴与开发提供了难得的历史机遇,尤其是2009年9月中俄两国正式批准了《中国东北地区与俄联邦远东及
镇江文宗阁始建于乾隆四十四年(1779),乾隆皇帝亲自题写阁名与“江山永秀”匾额。它不仅囊括了先秦至乾隆之前中国历史之主要典籍,而且涵盖了中国传统学术文化的各个学科门类与专
重点讨论哈尔滨市对俄科技合作的发展现状以及进一步分析如何加强对俄科技合作的对策和措施。
在工业生产管理中,市场需求、产品本身的需求以及设备运行效率等都是影响工厂生产能力的关键变量。这些变量在实际中的不确定性,导致了工厂生产能力计划的变动性。由于半导体