基于强化学习的多智能车协作超车策略

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:snowl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年传感器技术、信息处理和计算机技术高速发展,同时带动了智能交通系统,这给社会带来了极大的的经济效益。从驾驶员的角度看,智能车的出现使得人们在自驾出行的途中不被车束缚,并且可以减少由于人为因素,如酒驾、疲劳驾驶导致的交通事故。能有效提高行车的安全性,提高乘客的舒适度;从整个智能交通系统的角度看,将有助于解决当前安全和交通拥堵两大问题,并将大幅度提升当前交通效率低下的问题。超车是常见的驾驶行为,也是最容易引起安全事故和交通堵塞的行为之一。这是由于超车过程繁琐且环境复杂多变,每个过程都面临来自人为因素及道路环境不断变化的两个严重潜在事故因素。因此在众多驾驶过程中可能出现的操作中,超车成为了智能驾驶的难点之一。应急车辆包括救护车、消防车、警车等执行城市紧急救援服务的车辆。其在执行紧急救援任务时,是要保证争分夺秒,否则很有可能因为耽误短短的几分钟而引发严重的后果,使本可以避免的损失无法挽回。保证应急车辆超越常规车辆优先通行的过程中常规车辆主动避让,是城市应急救援力量快速部署的关键。因此,多个智能车主动配合救援车超车是极为重要的一环。本文主要研究在同方向直线双车道的公路上,多个无人驾驶车辆相互协作与协调完成自主超车的全部过程,包括变道、超车、返回原车道。首先采用强化学习中的经典Q学习算法完成非协作场景中的单智能车超车控制。因其应对复杂道路的具有局限性,提出了多智能体联合控制的Q学习算法和多智能体独立控制的Q学习算法。通过构建两车协作超车的模型在相同环境下对两种协作方式做出分析比较,为环境复杂多变且N个智能车间的协作超车策略提供重要依据。并将独立协作的Q学习算法应用到紧急救援场景中的智能车协作超车中,结合实际救援车超车场景和交通规则,确定了状态集合、动作集合以及从救援车和常规车两个角度给与奖惩,让救援车顺利超车、常规车辆主动避让。最终目的是让救援车以最短的时间安全超车并抵达目的地。最后引入共享经验的协作强化学习算法进一步提升完成整个超车过程的安全性和高效性。
其他文献
党的十八大以来,习近平总书记创造性提出了总体国家安全观,将政治安全、军事安全、文化安全、网络安全等传统安全和非传统安全统筹纳入其中,使其成为了新时代维护国家安全的
目的探讨延续护理在女性中、重度压力性尿失禁术后的应用效果。方法选取60例女性压力性尿失禁住院行无张力尿道中段悬吊术(TVT)患者为研究对象,随机分为观察组与对照组各30例
小城镇的规划和建设一直是我国城镇工作的重点,随着城镇化的推进,小城镇规划已经得到各界的重视,并把其作为政府的一项重要工作来抓。小城镇规划是事关小城镇发展的全局和长远大
探讨山东省不同地区家蝇对化学杀虫剂的抗药性现状。方法:采用常规点滴法。结果:不同地区家蝇对拟除虫菊酯类的抗性水平普遍较高;对有机磷类,则用量大、使用频率高的地区抗性水平
2008年以后,金融危机的影响从金融领域迅速向实体经济蔓延。为缓解经济下行趋势,各国央行颁布了一系列宽松的货币政策为实体经济发展保驾护航。我国政府也充分发挥“有形之手
台积电位于上海松江的晶圆十厂,今年8月初已开始投片试产。此举虽离原先规划的进程稍有延迟,但第四季量产的目标应不受影响。
本文简要介绍了用中规模集成数据比较器和计数器构成任意进制计数器的原理,并对其设计方法作了详细论述。
据国外媒体最新研究结果显示,虽然历史上溶剂型涂料在美国保护涂料和特种涂料行业中一直占据主导地位,但2020年之前水性涂料将在这一领域后来者居上,超越溶剂型涂料成为最主要的
新时代下教育建筑需要怎样的空间形式,现代教育理念如何与传统庭院空间交融。本文通过对山西省阳泉市巨兴小学的方案设计实例的介绍解读,浅述了因地制宜地对小学校教学空间设计