基于深度强化学习的车辆主动悬架控制研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:huishou2088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主动悬架系统因对不同路面与外界扰动的实时适应能力,具有较强的车辆平顺性控制潜力,近年来得到了汽车厂商与学者的广泛研究。传统基于模型的控制理论一方面依赖于数学模型的精度,另外一方面为了保证系统的实时性通常采用线性模型,这导致其在实际悬架控制中具有较大的局限性。而强化学习方法基于数据驱动,且不依赖于严格的数学模型,在主动悬架控制中具有较强的应用潜力。本论文为解决传统悬架控制方法的参数或工况适应性差问题,围绕主动悬架的深度强化学习控制方法开展研究,设计主动悬架深度Q神经网络(DQN)强化学习算法与面向半车的主动悬架深度确定性策略梯度(DDPG)算法,并进行随机道路条件的车辆悬架控制仿真测试,以期减小车身振动,提高车辆行驶平顺性。本文的研究内容包括:首先,建立主动悬架二自由度、半车与整车的动力学模型与路面激励模型,搭建用于与强化学习智能体交互的车辆悬架系统仿真环境,构建悬架状态-动作空间对应的系统动态响应数据集。其次,构建主动悬架深度强化学习控制问题,设计面向减速带的主动悬架DQN算法,提出车身加速度、轮胎动行程与悬架动挠度最小化的奖励函数,研究学习率、折扣因子、神经网络架构等参数对悬架控制策略训练效果的影响,以优化强化学习训练速度与悬架控制性能,求解兼顾舒适性和操纵稳定性的主动悬架最优控制策略。仿真结果表明,相比于传统悬架控制策略,基于DQN的主动悬架算法具有更好的平顺性与工况适应能力。然后,为提高强化学习在自由度更高(更大状态-动作空间)的半车主动悬架训练中收敛速度,提出基于DDPG的主动悬架控制策略,综合考虑车身加速度、俯仰角加速度等半车悬架性能指标设计奖励函数,进行随机路面条件下的控制策略训练与平顺性仿真试验。仿真结果表明,基于DDPG的主动悬架控制策略相比于DQN算法具有较快的收敛速度,不同道路条件与行驶车速的测试结果验证了所提算法的泛化性能。最后,为验证本文所设计的主动悬架深度强化学习控制策略的可行性,搭建基于dSPACE实时仿真系统的主动悬架硬件在环仿真试验平台,利用MicroAutoBox模拟二自由度悬架系统、路面激励和强化学习控制算法,以电磁作动器为执行器输出主动控制力,试验结果证明所提出的深度强化学习控制算法可以有效提高汽车的平顺性。
其他文献
学位
学位
学位
在钢筋混凝土结构中,钢筋和混凝土两种具有不同物理性质的材料能协同工作的前提是其两者之间具有足够的粘结应力。粘结界面损伤将导致钢筋混凝土结构的性能下降,甚至导致结构直接失效。因此,研究钢筋混凝土的粘结性能是诸多学者长期致力研究的热点课题。本文在总结国内外有关钢筋混凝土锈蚀膨胀对混凝土的破坏作用研究的基础上,基于钢筋电化学腐蚀理论,从动力学模型入手,采用元胞自动机(Cellular AutomataC
本文以地籍测量为应用背景,依托“村镇空间规划地理信息卫星快速测高与精确定位技术研究”课题,针对测量过程中全球卫星导航系统(GNSS)信号异常甚至失效的特殊测量阶段,结合地籍测量作业的低动态、“随停随测随走”及可事后处理数据的测量特点,对GNSS和捷联惯性导航系统(SINS)组合定位系统的误差抑制技术展开研究。本文的主要研究工作包括以下几个方面:(1)对面向地籍测量的GNSS/SINS数据融合算法进
作为医学检测、生物芯片、可穿戴设备的关键部件之一,光学生物传感器凭借着操作模式无损、适用目标广、响应速度快等诸多优势,广泛应用于免疫检测、在线分析甚至活体分析等。在众多光学传感机理中,光波导器件具有无标记检测、灵敏度高、易于集成等特点,成为未来生物传感研究的研究热点。以往研究中光波导器件的制备依赖现有半导体光刻工艺,在三维结构成型、材料延展性与生物相容性等方面存在不足。故而本文提出了基于双光子聚合
随着当前我国城市建设发展的转型,从以往的增量扩张转为存量提升,城市既有居住环境成为了当前城市建设的重点,老社区作为城市既有居住环境的重要组成部分,愈发受到了重视。近年来,国家大力推行老社区更新工作,以期提升人们的居住环境。公共空间作为老社区居民行为活动与社会交往的重要载体,在经过长时期使用后,其功能与空间环境已然不能够满足居民的日常生活需求,因此,这些亟待解决的老社区公共空间环境正成为当下城市更新
背景:阿尔茨海默病(Alzheimer’s disease,AD)是一种缓慢进展的神经退行性疾病,核心症状是记忆功能的持续恶化和生活能力的进行性丧失,占所有痴呆疾病的60%-70%。AD的病理特征为细胞外淀粉样蛋白-β(Amyloid-β,Aβ)异常聚集和细胞内神经原纤维缠结(Neurofibrillary tangles,NFT)。现有研究认为AD是一个连续谱系疾病,包括主观认知功能减退(Sub
α-磷酸三钙(α-TCP)骨水泥是一种新型的人工骨修复材料,具有良好的生物相容性和骨诱导性,在人体内可自行固化和生物降解。本文在骨水泥中分别加入有机添加剂聚乙烯醇、壳聚糖、海藻酸钠和玉米淀粉,并将无机添加剂羟基磷灰石(HA)、含钙和磷化合物的混合物、滑石粉分别与有机添加剂复合,研究了添加剂对骨水泥可注射性、抗压强度、固化时间、物相组成及断面形貌的影响。此外,对可注射磷酸钙骨水泥的抗溃散性进行了初步
我国首台南极科考支撑装置在南极成功运行,为南极天文观测及其他科考仪器设备提供能源、科考数据存储、通信、远程监控等保障,实现了我国在科考支撑平台研究领域零的突破。由于研制时间短,经验不足以及南极特殊的环境限制,南极科考支撑平台的性能还需要进一步完善。基于以上原因,本文从提高平台可靠性和安全性的角度提出无人值守能源通信平台的优化设计方案,以便为我国极地科考提供更可靠的保障。首先,分析能源通信平台的总体