基于深度强化学习的混合动力汽车能量管理策略研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:wenshicai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合动力汽车具有污染小、效率高、续驶里程长等优点,是未来新能源汽车的发展方向之一。由于混合动力系统拓扑结构的变化和驾驶场景的不确定性,制定高效的混合动力汽车能量管理策略(EMS)成为最关键的任务之一。在本文,以并联式混合动力汽车为研究对象,设计了几种基于深度强化学习的混合动力能量管理策略,对策略的最优性、适应性、收敛性和实时性进行了深入探究。具体研究工作包括:首先,以某型并联式混合动力汽车为参考,建立整车纵向动力学模型,以及发动机、电机和电池等关键部件数学模型。对典型的离线全局最优控制方法——动态规划(dynamic programming,DP)进行了能量管理策略的设计,作为后文所提策略的参考。其次,建立了基于值函数学习的深度Q学习(deep Q networks,DQN)在线能量管理策略,并设计了基于DQN变体,包括Double DQN、Dueling DQN以及结合彼此优势的D3QN的能量管理策略,并进行了仿真分析,并且与DP策略进行比较分析。结果表明:各种DQN变体相对于标准DQN在在收敛速度以及燃油经济性方面都有了一定的提高,而D3QN的控制效果最为理想。然后,建立了基于值函数和策略梯度的深度确定性策略梯度(deep deterministic policy gradient,DDPG)在线能量管理策略,为了消除不合理的转矩分配,在DDPG回路中嵌入了考虑部件工作特性和工作模式的规则式局部控制器(LC)。为了解决环境干扰的影响,设计了一种基于混合经验缓冲区(MEB)的混合经验回放方法(HER)。结果表明,提出的改进式DDPG能量管理策略均可获得良好的燃油经济性以及算法收敛速度和鲁棒性。最后,对常规在线局部优化控制方法模型预测控制(MPC)进行了能量管理策略仿真将基于DDPG算法的能量管理策略与基于DP、MPC、以及DQN及其变体的能量管理策略进行比较分析,表明了DDPG能量管理策略在不同行驶循环下的优越性。
其他文献
当前,随着人工智能技术的发展,汽车智能化水平大幅度提升,逐渐从实验室迈向工程应用,智能汽车融入城市交通首先要解决行车安全性问题。城市交通场景属于日常行车的常见工况,且城市交通场景往往较为复杂且存在不确定性,而智能汽车必须能够有效处理复杂城市交通场景下车辆的安全控制问题。针对无信号灯路段行人-车辆混行的常见城市工况,提出一种考虑人车混行的多场景动态安全距离模型,分别设计以舒适度为导向的避撞控制策略和
学位
近年来,无人机在室内场景中的应用越来越广泛,卫星拒止以及室内场景的随机性与复杂性,对无人机的自主导航定位带来了新的挑战。为满足无人机的智能安全飞行需求,导航系统必须输出持续可靠的导航定位信息,保证位姿解算的精度和鲁棒性。视觉传感器由于感知信息丰富,已经被广泛应用在无人机的室内自主定位方案中。在未知环境下,无人机通常采用视觉里程计算法实现自身自主定位,确保飞行稳定。但在室内复杂环境中,传统的基于特征
学位
图像超分辨率(super-resolution,SR)重建作为传统的图像处理问题,在计算机视觉上取得了广泛的应用。在学者们大量的研究下,基于深度学习的图像超分辨率重建技术取得了长足的发展。但现存的SR网络的退化模型主要以双三次下采样为基础,因此SR深度网络并不适用于自然界真实图像的重建,此外现有的的模型过于复杂,参数量巨大,难以实际部署于小规模的移动客户端。针对上述背景,本文在大量研究的基础上,提
学位
报纸
随着新课程改革的不断深入,传统教学模式已经不能适应时代发展,因此在小学语文课堂中开展有效地优化和创新小学语文学习方式是十分必要。本文主要从当前我国现阶段教育现状出发分析了目前存在问题并提出解决对策。
会议
近年来我国城市化进程持续加快,消费者市场对于基于位置的服务(Location Based Services,LBS)需求不断地提升。随着智能手机性能的不断提升,能检测到丰富的信号源的智能手机已经成为辅助行人定位导航的重要便携设备。本文分析了目前适用于智能手机的行人定位导航方法,同时研究了基于神经网络的误差修正模型,提高了行人导航在室内的导航定位性能。论文首先分析了基于智能手机的定位技术以及室内定位
学位
液体推进剂因比冲高、经济性好等优势,在航天领域中获得了广泛使用。但是,零/微重力下,它极易随充液航天器的机动变化在贮箱内晃动,与航天器结构、控制器等的频率发生耦合,产生显著的干扰力、力矩,影响系统的稳定性以及控制器的性能。因此,本文对充液航天器在轨机动过程中的液体晃动建模及姿态控制展开了研究,研究内容主要有以下几部分:(1)对液体大幅晃动进行建模与分析。基于MPBM,用一个半径不断变化的脉动球等效
学位
汽车侧翻是一种严重的交通事故,尤其是客车和SUV侧翻会造成严重的人员伤亡。本文针对SUV和客车的侧翻被动安全进行研究,对客车的侧翻耐撞性能进行分析和改进;兼顾SUV轻量化和平顺性,对SUV侧翻时顶部压溃耐撞性进行优化研究,有效提高了SUV和客车的侧翻被动安全性能。首先,根据客车侧翻试验标准ECE R66建立客车车身段侧翻有限元仿真模型并进行验证。基于仿真结果进行分析,客车侧立柱和腰梁的连接处是主要
学位
本文基于弹塑性断裂力学的内聚力模型研究晶界的微观裂纹扩展与轮盘的破裂转速:第一,内聚力模型模拟晶界微观裂纹扩展过程。在采用Voronoi tessellation方法建立的微观晶体有限元模型基础上嵌入表示晶界的内聚力模型以研究晶界失效。基于无厚度内聚力模型研究晶界的微观裂纹扩展,失效的内聚力单元与加载方向基本垂直,微观裂纹将沿与加载方向垂直的路径扩展,且宏观上只有一条主裂纹。基于考虑厚度的内聚力模
学位
随着航空发动机推重比的不断提高,发动机涡轮进口温度不断增加,发动机涡轮盘材料使用温度也在提高,对涡轮盘用材料的强韧性、疲劳性能、可靠性和持久性提出了更高要求。粉末高温合金因其良好的高温强度、高组织稳定性、低疲劳裂纹扩展速率、优异的抗蠕变和抗氧化性能,被广泛应用于制造高性能航空发动机涡轮盘,且通过梯度热处理可获得双组织(轮缘粗晶组织、轮毂细晶组织)双性能粉末高温合金涡轮盘,以满足涡轮盘不同部位对疲劳
学位