基于强化学习的城轨列车节能驾驶控制方法

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:fuhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市轨道交通以其高速度、高容量、高安全性、高可靠性等优势,逐渐成为城市公共交通系统中的重要组成部分。然而,随着城市轨道交通运营规模的不断扩大及车辆运行间隔的不断缩短,其运营能耗也在不断攀升,逐渐成为城市工业用电大户。据统计,列车牵引能耗在城市轨道交通运营总能耗中的占比可以达到35-45%,因此,通过优化列车驾驶策略,能够降低牵引能耗的使用,对城市轨道交通系统节能减排,促进环境友好型公共交通系统的建立,有重大意义。本文结合城市轨道交通列车节能驾驶问题特点,为节能驾驶策略的求解提出如下两点研究思路。首先,列车节能驾驶策略求解的一般思路为在规定运行时分内最小化牵引能耗,但这种思路需要以列车运行时分为中介,使得求解过程更为复杂。针对此问题,本文基于最优牵引能耗与规定运行时分的一一对应关系,提出了列车节能驾驶的反问题,即利用固定的牵引能耗最小化运行时分,并基于该反问题直接求解节能驾驶策略,从而直接从最优能耗的角度出发确定最优驾驶策略;其次,本文使用数据驱动的方法求解列车节能驾驶策略,这类方法既能充分利用城轨系统运营过程中产生的大量运营数据,又可以省略复杂的建模过程,避免建模精度对求解精度的影响。值得注意的是,由于城轨系统每日产生的运营数据具有较强的重复性,这样的特点适合强化学习方法进行处理并从中学习最优驾驶策略。综合以上研究思路,本文提出一种基于强化学习的列车节能驾驶控制方法。具体工作如下:(1)提出列车节能驾驶问题的反问题,针对该反问题引入了一种基于能耗分配的列车节能驾驶策略求解方法,并提炼该方法的马尔科夫特性,将列车节能驾驶问题转化为有限马尔科夫决策过程,使其可以使用强化学习方法进行求解。本文基于列车节能驾驶问题的特征,对强化学习框架中三个关键元素,即状态、动作和奖励,进行了定义。(2)提出一种基于Q学习方法的节能驾驶控制方法。为了满足Q学习方法使用表格存储值函数的要求,本文分别基于列车运行时分与能耗分配状态,提出了两种状态表示方式。此外,通过仿真实验,验证了本方法的有效性,并分析了本方法的超参数敏感性。(3)针对Q学习方法无法应用于大状态空间的问题,本文提出一种基于深度Q网络的节能驾驶控制方法。与Q学习方法相比,本方法可以优化多站间整体的节能驾驶策略,在提高整体节能效果的同时,优化了不同站间的运行时分。此外,通过仿真实验,分析了不同超参数取值及网络结构对算法性能的影响;(4)针对深度Q网络方法在大动作空间决策效率降低和训练时间过长的问题,本文提出一种基于柔性Actor-Critic的节能驾驶控制方法。与Q学习方法和深度Q网络方法相比,本方法在采样复杂度方面具有明显优势,可以减少95.97%和75.03%的训练片段数。同时,通过超参数扫描,验证了本方法对不同超参数取值的收敛性和稳定性。本文包含图39幅,表25个,参考文献98篇。
其他文献
钢筋混凝土作为最普遍建筑结构,钢筋锈蚀带了严重的经济损伤、使用安全等问题。将纤维增强复合材料筋应用与建筑结构中,不仅能够有效的解决钢筋锈蚀问题,而且还能配合海水海砂混凝土进行应用。FRP筋混凝土是否有良好的粘结性能是工程应用的关键。目前,有充足的研究表明FRP筋与混凝土有良好的粘结性能。然而,在实际工程应用中FRP筋混凝土不仅需要有良好的粘结性能,粘结耐久性能也是至关重要的。冻融破坏作为建筑结构破
学位
虚拟编组是作为轨道交通行业的一项突破性创新,主要利用低延时的车车通信技术以及精确的列车控制算法降低列车的追踪运行距离,总体提升了线路的运行效率。然而随着列车间安全余量的缩短与系统复杂程度的增长,对系统的运行安全性要求更高。与此同时虚拟编组需要同时考虑到线路、车辆、信号、通信等多个方面的条件,才能突破原有的约束完成虚拟编组的功能和线路的运能需求。一旦在虚拟编组的危害处理过程中无法在限定时间内做出合理
学位
顶管施工实际由两部分组成:1)工作井开挖施工;2)顶管推进过程施工。顶进的过程中,导致工作井周围土体形成摩尔库伦主动区与被动区,主动区一侧的土体卸载塌陷,被动区一侧的土体加载隆起。一方面,研究土体开裂与隆起范围对减小顶管施工对周围环境影响有积极意义;另一方面,在顶管施工过程中,研究工作井能承受多少顶进反力、土体能提供多少阻力对实际工程的指导也具有重要意义。本文通过采用理论分析、模型实验、数值模拟等
学位
城市轨道交通作为一种载客量大、运转周期短、单位能耗低的客运手段,是城市现代交通体系的主体部分,随城市化进程加快得以迅速发展,同时能耗问题日渐突出。城轨系统牵引能耗占比高,原始能耗数据繁杂,统计分析难度高,异常用能情况不易被及时发现,影响节能减排工作开展。牵引能耗异常分析基于列车运行数据判断并定位异常,为优化能源利用提供参考意见。城轨系统牵引能耗数据量庞大,工程现场基于周期统计和经验结论设定统一阈值
学位
电镀废水作为一种典型的难降解有机废水,排放量大、毒性强、难降解,对环境危害较大。如何实现电镀有机废水的环保、高效、低成本处理成为研究的热点。目前,电镀废水的处理方法主要有化学混凝、臭氧氧化法、芬顿氧化法等化学法,电解法、膜技术等物理法及生物法。生物法因具有耗能少、工艺设备简单、成本低、不会造成二次污染等特点,在电镀有机废水处理方面有明显优势。针对现有传统生物处理法难以有效处理难降解有机物质、剩余污
学位
近年来,深度学习技术快速发展,各种高性能神经网络模型相继被提出,并在各个领域得到了广泛应用。将卷积神经网络(Convolutional Neural Network,CNN)应用于路面裂缝智能检测不仅是当前的研究热点之一,而且具有工程实际意义。数据集是训练CNN模型的关键,也是影响裂缝检测效果的主要因素。但传统的监督学习方法需要大量标记的数据集,存在不足之处。一方面,标记过程需要消耗大量劳动力;另
学位
时序干涉测量技术(Time-Series Interferometric Synthetic Aperture Radar,TS-InSAR)技术出现以来,被广泛应用于多种地表的形变监测。与传统的大地测量手段相比,时序InSAR技术能提供大范围的形变监测结果。然而该技术应用于低相干性地区时,经常出现监测结果不佳的情况。已有研究表明,结合多极化数据能提高时序InSAR技术的形变监测结果。对此,本文以
学位
文章针对智能建筑电气设备的安装施工技术进行分析,以实际项目为例展开探索研究,希望能够起到积极的促进作用,保证施工前的深化设计效果,做好施工中的技术应用管理,为智能建筑提供一个安全、稳定、可靠的运行环境。
期刊
采用有效的方法反演精细的三维月壳和上月幔结构对认识月球形成演化过程、质量瘤形态结构、未来开采新能源等均具有重要意义。常用于反演月壳与上月幔结构的月震波方法受限于月震台站稀少,给出三维结果的空间分辨率不足。随着重力测量技术的发展,重力方法越来越具有竞争性,但也存在垂向分辨率不足问题。重力多尺度分析技术已经被证明可以有效改善该问题,在地球内部精细结构反演中具有广泛的应用。为此,本文基于最新GRAIL卫
学位
近年来,我国的经济建设取得了较好的成绩,人民的生活水平得到了很大提高,更多的人们开始追求高品质的生活质量。其中,建筑工程贯穿于人们日常生活中的每一个场景,建筑物的美观性和舒适度直接影响到人们的生活体验和幸福感,在所有要素中最重要的是建筑工程的安全问题。因此,相关领域的工作人员需要进行多角度的思考,完善各方面的工作质量,尤其需要注重优化电气安装工作效果,完善以往存在的问题,从根本上提高电气使用质量,
期刊