基于强化学习的重载列车运行优化研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:liongliong506
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的进步,我国交通运输行业发展尤为突出,其中轨道交通运输业在各方面都具有跨越式进步,积累了大量领先世界的前沿技术。在当下的国民经济快速发展时期,轨道交通运输的压力也越来越大。重载铁路作为大宗商品运输的重要途经,线路距离长且环境多变,面对如此环境,驾驶人员极容易产生疲劳。本文以大秦线上运行的HXD1机车牵引1万吨货车作为研究对象,通过强化学习方法训练出一套重载列车辅助驾驶系统,以缓解驾驶人员疲劳、保证列车安全、提高列车运输效率。针对重载列车的运行效率问题,本文利用TD3和PPO两种强化学习算法进行了控制策略的学习。首先通过对重载列车机理模型进行了分析与建模,作为后续实验的基础;再将重载列车运行过程划分为牵引启动、巡航控制和停车制动三个部分,以解决强化学习在长时间运行的环境中无法学习到策略的问题;并基于实际控制列车需要参考的条件设计状态空间,根据HXD1机车的牵引特性确定了动作空间的连续性;并根据安全、稳定、高效的目标设计了奖励函数,训练了两种智能体。仿真结果表明,本文设计的状态与奖励函数能够使智能体学习到高效驾驶重载列车的控制策略。针对重载列车运行的稳定性问题,本文设计了基于专家监督的强化学习训练方案,使智能体更稳定的驾驶列车。首先通过循环神经网络对专家行驶数据进行了行为克隆,克隆出的策略网络作为专家网络用来监督强化学习的训练,达到了加快训练的效果;并且通过添加控制力变化幅度的约束,减少列车控制力的频繁调整;通过随机初始化巡航阶段和制动阶段的初速度,训练一个对环境切换速度不敏感的巡航控制策略和停车制动策略;最后通过在牵引启动、巡航控制、停车制动的分段点设计软切换约束,降低因控制工况切换产生的控制力跳跃。仿真结果表明,基于专家监督的强化学习训练方案得出的控制器,控制更加稳定,能够保证列车安全运行。由于强化学习环境中没有一个开放的重载列车仿真器观察和调试,并且缺少重载列车实际运行数据。本文利用Qt设计并搭建了重载列车仿真平台,通过观察列车运行效果,辅助调试算法可能出现的问题,并用以生成专家驾驶的运行数据,辅助专家策略网络训练。
其他文献
伴随着资源枯竭和环境污染等问题日益突出,新能源汽车逐渐活跃于大众视野。与传统燃油汽车的驱动装置不同,新能源汽车采用电机集成驱动,电机噪声远小于内燃机噪声,但由于缺失了发动机噪声的掩蔽效应,传动系统产生的振动噪声显得更为突出。为了追求更高的行驶速度,电机高转速输入导致对齿轮传动系统的设计也更加严格,多级齿轮传动系统的振动和噪声成为关注的重点。本文以某款新能源汽车的多级齿轮传动系统为研究对象,以改善多
学位
在生活质量提高的今天,人们对高清晰度图像的需求变高,之前的超分辨率重构方法已不能满足人们对于高质量图像的需求。所以基于深度学习的超分辨率(Super-Resolution,SR)技术被提出来提高图像的质量以满足多领域各人群的需求,其应用价值极为广泛,例如卫星监测、医疗军事、数字媒体,遥感等。近年来,深度学习技术不断发展,卷积神经网络(CNN)在SR重建方面取得很大成功。本文重点研究CNN的单幅图像
图像超分辨作为计算机软件层面的算法,其目的是对图像中的模糊部分进行处理,从而从低分辨率图像中恢复细节信息,重建高分辨率图像。当前,基于卷积神经网络的图像超分辨技术通过对低分辨率图像特征的自主学习,重建的高分辨率图像获得了显著的突破。因此,该类方法受到了国内外学者的广泛关注,并成为现今图像超分辨领域的研究焦点。但图像超分辨是一个高度不适定的问题,同样的一幅高分辨率图像可以通过不同程度的低分辨率图像所
乳腺癌是全球最常见的癌症,其发病率和死亡率居高不下,严重危害着女性的健康。组织病理图像分析是乳腺癌诊断的“黄金标准”,但图像的复杂性和多样性使得病理医生的诊断过程耗时耗力且效率低下。另外,病理医生的经验阅历不同以及分析病理图像时的主观性甚至可能会导致误诊。目前,深度学习在计算机视觉和图像处理等领域崭露头角,也为计算机辅助诊断提供了一种新的思路和途径。本文以苏木精-伊红染色的乳腺组织病理图像数据集为
从水下视频和图像中自动探测和识别鱼类目标对于评估渔业资源、生态环境监测等具有重要意义。但由于水下图像存在着低光照、水体浑浊、海床背景复杂、鱼类姿态多样、目标尺寸变化大、分辨率和对比度低等问题,传统的手工设计特征提取和单纯使用基于CNN的目标检测等算法并不能满足真实水下检测需求。在实现水下鱼类目标检测过程中,首先需要解决水下低分辨率、低质量的鱼类图像问题,以及在得到重建的高分辨率鱼类图像后,鱼类目标
乳腺癌是女性常见癌症之一,严重影响女性身心健康。计算机辅助诊断(ComputerAided Diagnosis,CAD)模型能有效辅助病理医生临床诊断工作,实现早发现、早诊断、早治疗,为提高人们生活质量奠定重要基础。现有研究工作:一方面,医学样本稀缺,模型易过拟合;另一方面,多使用单类别特征,而未充分挖掘并利用异构图像特征间蕴含的跨模态病理语义,同时忽略不同特征在乳腺癌图像识别中的重要性。为此,提
学位
复杂时变动态系统在科学与工程应用领域中是非常重要的一类问题。此外,实际应用中噪声的存在会影响模型性能,导致求解精度不高等不良效果。因此含有噪声干扰下的时变动态系统的求解是值得探究的。传统的固定参数的收敛微分神经网络由于参数选定不能超过参数变化的上限,其收敛效果以及收敛速度都会受到初始极限值的限制。因此,根据自适应时变参数设计思想,论文提出一种新型的混合变参动态学习网络(Mixed variant-
随着工业生产线智能化水平的提升,焊接机器人被广泛用以提高生产效率。在实际生产过程中,焊接机器人不仅需要完成数量众多的焊点焊接任务,且还需尽可能的提高生产效率、减少能量消耗、运行平稳。因此,本文以焊接机器人为研究对象,对过给定路径点的焊接机器人最优运动轨迹展开深入研究。首先对白车身侧围结构和焊接机器人路径规划影响对象进行了研究,分析了制造资源、点焊工艺及资源整体布局对焊接机器人运动规划的影响。基于数