基于深度强化学习的并联式HEV能量管理策略研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:king0083
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
混合动力汽车的节能方法和能量管理策略一直是汽车行业的重点研究对象。但是,目前实际应用最广泛的依然是基于专家经验的能量管理策略。以混合动力汽车的智能能量管理策略为研究重点的成果极少。因为混合动力电动汽车具有复杂的结构,并且其在运行状态下的工况通常是未知的,所以设计出一个应用于混合动力汽车的自适应并能持续自我更新的能量管理策略并不容易。本文以深度强化学习算法为基础,对并联式混合动力汽车的能量管理策略进行研究。论文的主要工作包括:1.混合动力汽车能量管理策略的分类及算法分析对国内外已有的混合动力汽车能量管理策略进行总结,将能量管理策略算法分为三个大类:基于规则、基于优化和基于学习。通过对能量管理策略的问题关键点进行进一步地分析,选用了等效油耗作为实验结果的判断标准。2.基于深度强化学习的并联式混合动力汽车能量管理策略设计详细设计了能量管理策略模型、Loss函数和经验池回放机制等内容,制定了离线训练、在线学习以及离线预训练结合在线学习的仿真方案,并通过Matlab-Python完成了程序的设计,并联合Advisor进行了仿真。实验结果表明:通过在线学习与离线训练相结合的方式可以极大地减少训练和学习的整体时长,并降低工程应用成本。基于深度强化学习的能量管理策略可以自适应变化的工况,取得了满意的节能效果,还能通过自我学习不断地更新策略。3.基于模糊控制算法及PSO优化模糊控制算法的对比实验设计在基于模糊控制算法的能量管理策略中,使用了总需求转矩、荷电量与发动机转矩三者建立模糊规则,选择了Sugeno型模糊推理系统,最后,将正态型的高斯函数作为输入量的隶属度函数;在基于PSO优化模糊控制算法的能量管理策略中,使用了设计好的模糊控制器隶属度函数参数及模糊规则作为粒子,选择了等效油耗作为算法优化过程中的适应度值。对比实验均在NEDC工况下进行。实验的结果表明:基于深度强化学习的能量管理策略在充分学习及训练的情况下相比其他两种算法拥有更加优秀的节能效果,并且算法因其自适应、自学习的特点,具备实现通用算法的潜力。
其他文献
随着核工业的迅猛发展,越来越多的核工业为人类生活提供了便利,但核事故的发生会给人类带来不可承受的后果,因此开发一种对铀酰离子具有超快吸附速率、强大的吸附能力和便于
越来越多的社会民众通过网络表达自己的观点,采集和分析其中用户发表的观点具有重要的意义。但目前的采集和分析系统存在着数据不完整、不及时和不真实等因素,导致分析的结果
[目 的]冠心病严重威胁人类健康,国外已有大量研究证实职业紧张影响冠心病的发生和发展,但国内有关职业紧张与冠心病发病和预后的研究还较少。本研究通过观察不同职业紧张程
随着我国能源需求不断增加,化石能源紧缺,传统供能系统效率低、污染环境等问题严重制约了国民经济的发展。区域能源供能系统以综合利用率高、低碳环保、可靠性高等特点成为国
近年来,随着社会发展,地面空间已不足以满足人们对交通和城市建设需求,越来越多的地下空间和超高层建筑得到青睐,地铁和桥梁的建设也更加凸显出其重要性。桥梁隧道的建设可有
竹管是一种各向异性材料,其横向性能远弱于纵向,实际竹结构工程中的竹管经常在横向集中力的作用下发生破坏。为充分发挥原竹的优势,本文针对竹管的横向力学性能进行试验分析
随着我国交通、水利及采矿业的快速发展,高地应力环境中的岩体开挖越来越多。在高地应力区工程开挖过程中,常常遇到以岩爆为典型的地质灾害。岩爆具有突发性和极强的破坏性,
本试验通过日粮中添加不同水平β-胡萝卜素,研究β-胡萝卜素对育成期奶牛生理、生化及生长性能的影响。试验采用随机区组设计,选取体重、体况相似、12月龄左右初配荷斯坦奶牛
川崎病是中型动脉系统性血管炎,主要影响冠状动脉。川崎病治疗的主要目的是尽量减少发展冠状动脉瘤的风险。实际上,这意快速抑制川崎病急性期炎症反应。川崎病的标准第一治疗对策包括静脉注射免疫球蛋白(IVIG)和阿司匹林。目前的指南建议在发病的后7天内服用2克/公斤的IVIG和80至100毫克/公斤的阿司匹林。对大多数病人,单剂量IVIG与大剂量阿司匹林联合治疗解决发热和显著降低冠状动脉瘤的发生率。然而,在
在压水堆物理计算中,通常先采用多群计算得到栅元或组件的多群能谱,再进行整个堆芯的扩散计算。多群数据库为组件计算提供必需的群常数,一般与组件程序配套开发,在一定程度上