论文部分内容阅读
本文针对列车动力学行为具有不确定性的情形,研究列车自动驾驶算法的设计,主要包括两个方面:一、针对高速列车速度控制问题,本文依托于列车的纵向多质点模型,并将列车运行过程中的不确定参数、时滞、非线性、随机性显式地包含于模型之中,提出适用于该系统的鲁棒H_∞控制判据;二、针对重载货运列车最优驾驶问题,利用强化学习算法,在智能体不具备列车动力学相关先验知识的条件下,使用生成的样本数据,求解多辆电力机车的最优操纵策略。在环境中则模拟了传感器误差和执行器误差发生的情形。本文的主要研究内容及创新点如下:1.将高速列车建模为一个带有不确定参数的多输入多输出系统,其中不确定参数包括列车质量、车钩刚度系数、机械阻力与空气阻力系数。将该系统在平衡点附近线性化,基于Lyapunov稳定性原理得出了使该系统稳定且具有鲁棒H_∞性能的充分条件,即判据A。在上述线性模型的基础上,高速列车被建模为带有不确定参数和单时变时滞的多输入多输出系统。类似地,本文利用Lyapunov函数得出该系统稳定且具有H_∞性能的充分条件,即判据B。仿真实验表明,与判据A相比,判据B在状态时滞存在的情形中表现出更加稳定的速度跟踪性能。2.考虑到列车各车厢单元时滞的差异性,以及高速列车运行中的非线性阻力特性,将高速列车建模为一个具有不确定参数、多重时变时滞、非线性和随机性的多输入多输出系统。在时滞上界和时滞导数上界已知的情形下,本文利用Lyapunov-Krasovskii函数得出了使得该系统稳定并具有H_∞性能的充分条件,即判据C。仿真实验表明相比于既有文献中的高速列车鲁棒自适应控制器,本文所提出的H_∞控制器使列车达到新稳态的时间较长,但其所需求的牵引/制动力的幅值较低,对牵引/制动功率要求较低,且不会引起高频振动。3.在时滞上界未知、时滞导数上界已知的条件下,本文针对具有不确定参数、多重时变时滞、非线性和随机性的多输入多输出系统得出了另一H_∞控制判据,即判据D。仿真实验表明,与判据C相比,判据D速度跟踪精度较高,但车钩力和车钩伸缩振动的强度较大,并且牵引功率需求与能耗较高。4.基于Q学习和蒙特卡洛控制算法,得出重载列车中多辆电力机车的最优操纵策略。该算法不依赖于列车系统动力学相关的先验知识,能同时优化速度跟踪误差、车钩力、能耗等多个目标,满足电力机车牵引/制动特性、级位转换速率等多项约束。仿真过程通过并行牵引计算框架模拟列车控制-响应过程,使用生成的数据样本估计行为值函数,得出了起伏坡道上多电力机车最优操纵策略。5.提出了一种针对重载列车中多辆电力机车优化操纵问题的行为值函数估计器:双编码Q网络。仿真证明,相比于Q学习和蒙特卡洛控制算法,双编码Q网络能够显著地提升问题求解效率,扩大问题求解规模,并对行为值函数具有显著降噪作用。基于28组仿真案例得出了起伏坡道上重载列车电力机车的最优操纵策略,讨论了影响双编码Q网络收敛速度的因素。