基于深度强化学习的车辆跟驰控制

来源 :中国公路学报 | 被引量 : 0次 | 上传用户:xuxu517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对自适应巡航控制系统在控制主车跟驰行驶中受前车运动状态的不确定性影响问题,在分析车辆运动特点的基础上,提出一种能够考虑前车运动随机性的跟驰控制策略.搭建驾驶人实车驾驶数据采集平台,招募驾驶人进行实车跟驰道路试验,建立驾驶人真实驾驶数据库.假设车辆未来时刻的加速度决策主要受前方目标车辆运动影响,建立基于双前车跟驰结构的主车纵向控制架构.将驾驶数据库中的驾驶数据分别视作前车和前前车运动变化历程,利用高斯过程算法建立了前车纵向加速度变化随机过程模型,实现对前方目标车运动状态分布的概率性建模.将车辆跟驰问题构建为一定奖励函数下的马尔可夫决策过程,引入深度强化学习研究主车跟驰控制问题.利用近端策略优化算法建立车辆跟驰控制策略,通过与前车运动随机过程模型进行交互式迭代学习,得到具有运动不确定性跟驰环境下的主车纵向控制策略,实现对车辆纵向控制的最优决策.最后基于真实驾驶数据,对控制策略进行测试.研究结果表明:该策略建立了车辆纵向控制与主车和双前车状态之间的映射关系,在迭代学习过程中对前车运动的随机性进行考虑,跟驰控制中不需要对前车运动进行额外的概率预测,能够以较低的计算量实现主车稳定跟随前车行驶.
其他文献
扩张型心肌病(DCM)时因心室肌结构异常,从而影响左右心室活动及机械收缩。当病变累及传导系统或激动波沿瘢痕组rn织不均匀扩布时,某些心室段电活动将延迟,作者提出,双室起搏BiV可
市政排水工程对现代城市的正常运行起着基础性作用。做好市政排水工程的建设,对推进城市现代化进程意义重大。本文对市政排水工程的管理现状进行分析,并提出解决现存问题的相关
随着我国国民经济的高速发展,国内的建筑事业也得到巨大的发展。由于建筑工程项目越来越多,建筑工程的质量问题越来越得到人们重视。建筑工程的质量直接与人民的生命和财产直接
传统乳腺脓肿的治疗采用切开引流、加强换药促进肉芽生长Ⅱ期愈合的治疗方法[1],换药时间长,患者痛苦,愈合后瘢痕明显.为改善乳腺脓肿切开引流后愈合效果,笔者2006年6月~2009
急性房颤(持续时间〈48h)病人常需急救药物抢救,并得住进心脏护理病房。早期复律可迅速缓解症状,减少血栓栓塞的危险性,降低房颤再发的机率,是治疗的关键。已进行了一些随机对照
随着社会的不断进步,人们对木制品的关注度也越来越高。马尾松是一种常用的工农业木材,如今已被广泛应用于建筑、家具的生产制造中。马尾松是目前经济效益最大的木材之一,能够作
上海的5月,是中国的节日,世界的节日,也是信息通信业的节日。5月1日,举世瞩目的中国2010年上海世博会如约而至。主题为“城市,让生活更美好”的本届世博会,在信息通信技术的
期刊
呼吸暂停(AOP)是新生儿尤其早产儿常见的临床症状,在我国呼吸暂停在早产儿的发病率约为23%,在住院新生儿中发病率61%,大多为原发病。呼吸暂停是指呼吸停止超过20s并伴有心动
早期的起搏器治疗有症状的心动过缓只有心室起搏,近期的起搏器既可心房起搏又可心室起搏以获得房室同步起搏(生理起搏)。初步研究表明生理起搏可能优于心室起搏,生理起搏发生房