基于深度强化学习的智能网联混合动力汽车队列分层控制

来源 :厦门大学 | 被引量 : 0次 | 上传用户:dongyu661
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界汽车保有量的迅速增加,环境污染、交通拥堵,交通事故,能源短缺等问题频发。有研究表明,基于车联网技术的车辆队列控制可以提高道路容量和道路通行率,有效减少交通事故和交通拥堵。当前的智能网联车辆队列控制多为电动车队列控制,存在着乘坐舒适性差、较少应用于混合动力汽车、无法充分发挥混合动力汽车节能潜力等问题。如何在保证队列安全性、稳定性的前提下提高车辆乘坐舒适性和燃油经济性,是队列控制算法的开发难点。本文提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的智能网联混合动力汽车(Connected Hybrid Electric Vehicles,CHEV)队列分层控制方法,建立了队列动力学模型,设计了上层多目标纵向队列控制算法和下层多系统动态协调控制算法。本文的主要研究内容分为如下几个方面:(1)智能网联混合动力汽车队列动力学建模。队列动力学模型包含车辆动力学模型和车间距离模型两部分。首先,基于功率分流式混合动力汽车动力系统构件实验数据,选择合适的建模方法,在Python中建立功率分流式混合动力汽车动力学模型,为后续进行智能网联混合动力汽车队列控制提供仿真平台和模拟环境。然后,在分析不同的车间距离模型与加速度输入输出特性后,建立基于固定车头时距的车间距离模型。(2)提出基于模型预测控制(Model Predictive Control,MPC)的上层多目标纵向队列控制方法。建立通信层,对道路中车辆信息进行收集和处理。采用基于状态反馈误差的鲁棒预测模型,来消除由于参数误差或者车辆动态特性变化引起的模型失配现象,增强预测模型的准确性和鲁棒性。分析基于车辆安全性、舒适性和经济性的多目标优化问题,建立相应的目标函数,有效解决了多目标对于车辆控制要求相矛盾的问题,利用模型预测控制算法不断优化加速度增量,从而获得最优期望加速度。采用WLTC工况进行仿真,从队列安全性、稳定性与乘坐舒适性三方面对仿真结果进行分析。(3)提出基于深度强化学习的下层多系统动态协调控制方法。下层控制器根据上层控制器求解的最优期望加速度以及当前车辆状态信息,求解最优发动机功率与电机功率分配方案以提高车辆的燃油经济性。首先,根据发动机与电机动态特性,选择发动机为主要控制对象进行控制,将由发动机最优工作曲线和电池特性组成的专家知识嵌入到深度强化学习算法中,利用发动机最优工作点曲线,减少控制量,降低控制量维度,缩小算法搜索范围,降低计算负担,提高算法的计算速度。然后,分析车辆各个状态量对深度强化学习算法动作值的影响,阐明基于深度强化学习算法的下层多系统动态协调控制原理。其次,采用在离散空间表现良好的深度Q学习算法(Deep Q-Network,DQN)进行基于DQN算法的下层多系统动态协调控制器设计,为了解决由于离散化所导致的控制量不准确问题采用在连续空间表现良好的确定性策略梯度算法(Deep Deterministic Policy Gradient Algorithm,DDPG)进行基于DDPG算法的下层多系统动态协调控制器设计。最后,NEDC工况下仿真结果表明,基于DQN的下层算法比基于DDPG的下层算法,计算速度快,但算法收敛速度慢,燃油经济性差。(4)智能网联混合动力汽车队列分层控制方法仿真验证。采用IM240工况和HWFET工况进行仿真,结果表明,本文所提出的两种基于深度强化学习的智能网联混合动力汽车队列分层控制算法,均可以在保证队列中车辆安全平稳的跟随前方车辆的同时,提高了车辆的燃油经济性和乘坐舒适性,但基于DDPG算法的CHEV队列分层控制方法适应性更好,燃油经济性更高。
其他文献
煤炭是我国重要的战略资源,在我国的能源中占有极其重要的地位。作为我国的基础产业,煤炭产业为我国的经济发展提供了强有力的支撑。然而近年来,由于受到国际和国内整体形势的影响,我国经济存在着较大的下行压力,经济增速逐步放缓,再加上新冠疫情的冲击,作为周期性行业的煤炭产业景气度趋弱。其中,煤炭中小企业普遍面临着资金困境,其资金需求量大、融资成本高,且融资渠道狭窄,再加上银行等金融机构调低煤炭企业的信用评级
学位
人才是企业成功的关键,在越来越多成功的企业中,优秀的人才具有非常重要的位置。在这个知识经济高速发展的时代,人力资源被许多企业视为成功与否的战略财富。关注员工的心理动向、了解他们对公司的满意度也是很多公司关怀员工的一种方法。员工满意度与忠诚度终决定着顾客的满意与忠诚,顾客的满意决定企业营业额的增长与否。所以,不论是在企业的常态化发展中还是发展的新阶段中,员工工作满意度对任何企业的长远高效健康发展都至
学位
我国的国有企业改革之路一直在发展中不断前进,混合所有制改革也是其中最为重要的课题之一。近年来,在深化国有企业改革的政策导向下,发展混合所有制经济再次被频繁提及,其目的就是为了在混合所有制改革中吸收非国有资本从而实现优化国有企业的治理机制、增强企业绩效。在混合所有制改革方案中,股权的安排是一项重要内容,而与股权安排相关联的控制权安排则体现了公司的治理水平。这是因为控制权安排是企业控制环境的重要一环,
学位
为缓解企业中的代理问题并降低成本,股东制定出将薪酬业绩相关联的激励制度,借此对企业经营者实施激励、监管。此外,由于处于社会环境当中,高管会存在比较心理,即在关注自身回报的同时,还会与他人薪酬进行比较,若比较的结果未达到管理层的心理预期,可能会导致其产生紧张、不公平的消极情绪,也就是心理学中的攀比心理,这种心理状态促使其期望能够提升自身收益,继而为高管操纵企业盈余提供了借口与动机。在这其间,盈余管理
学位
大力推广新能源汽车,是中国汽车产业从汽车大国转型为汽车强国的重要途径,也是中国减少碳排放、实现碳中和的重要举措。《十四五规划和2035年远景目标纲要》明确指出,要将新能源汽车作为战略性新兴产业去做大做强。在政策推动以及市场需求的情况下,会有部分企业通过并购的方式进入新能源汽车相关领域,2017年至今累计发生近700起汽车行业并购交易,并购交易有关金额近5000亿元,考虑到新能源汽车市场的发展前景,
学位
20世纪80年代,学者们在对股票收益率的研究中发现了一些CAPM无法解释的现象,并称之为“金融异象”,账面市值比效应就是其中一个备受关注的重要异象。Stattman(1980)发现账面市值比越高的公司,其股票收益率通常也越高;账面市值比越低的公司,其股票收益率往往也越低,即股票收益率与公司账面市值比之间存在正相关性,这就是账面市值比效应。本文认为,账面市值比可以在一定程度上反映公司所面临的风险,因
学位
我国的房地产企业当前面临着融资渠道单一、融资成本过高的问题。同时,房地产投资又有一个显著的特点就是资金回笼周期很长,在一次性投入大额开发费用后,若没有强有力的需求拉动,则需要很长时间进行资金回笼以进行下一次投资。单一的融资渠道加上漫长的资金回笼周期都给房地产企业的健康发展带来了严峻的挑战。虽然这些困难在我国显得难以克服,但对于许多发达国家而言,由于房地产投资信托基金(REITs)的出现与发展,这些
学位
经济的快速发展使得人们对交通的需求越来越大,列车的载重和速度逐渐增高。为了保证桥梁的动力可靠性和行车安全性,研究其动力效应至关重要,但目前国内外对大跨径连续梁拱桥动力特性研究尚不充分。因此,开展大跨径连续梁拱桥自振特性及车桥耦合动力响应研究具有重要的现实意义。本文以某高速铁路大跨径连续梁拱桥为研究背景,总结了桥梁自振特性、车桥耦合振动、动力系数的研究现状。利用Midas/civil进行连续梁拱桥自
学位
如今,我国各行各业力争早日实现双碳目标,其中建筑行业对于节能减排蕴藏着巨大潜力。胶合木,作为一种天然可再生的绿色材料,具有出色的结构强度、可靠的耐火性、灵活的设计等特点,广泛应用于大型公共设施、商业建筑、文化及体育场馆等。然而,普通的胶合木梁在受弯时易在梁底木节等缺陷处发生脆性破坏,不仅破坏突然且有一定的危险性,材料也难以充分发挥强度。因此,需要采取一定的措施改变胶合木梁的破坏形态,增强其受弯性能
学位
航空发动机工作环境恶劣,工况复杂,对其附件提出了非常高的要求。燃油泵调节器作为一种典型的高集成航空发动机附件,在控制系统起关键作用,其工作的不可靠性直接危害飞机的飞行安全。飞行环境下,燃油泵调节器受到来自发动机机匣和内部器件工作造成振动、摩擦等,容易引发故障。为了保证燃油泵调节器的可靠性,需要对其进行动力特性分析,通过仿真技术与实验分析互相结合,提高实验分析能力并更新仿真模型,进而获取所需的工程数
学位