基于深度强化学习的城市道路交通系统信号控制策略研究与仿真

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:qq147662
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
平面交叉口是影响城市交通系统通行能力的重要交通节点,长期以来国内外研究学者致力于对交叉口信号控制算法做出合理地改进,但受到交通系统复杂性与随机性的制约,改进后的信号控制算法往往缺乏实时性与准确性,并且不能得到实际上的验证与普及。因此,为提升城市道路交通系统交通资源的利用率,缩短车辆在交叉口的通过时间,提高交通信号控制的灵活性和精确性,本文提出了一种基于深度强化学习的交通信号控制策略,并搭建仿真平台对算法的控制效果进行验证。主要工作如下:1.详细阐述了强化学习、深度学习及深度强化学习应用于城市道路交通系统的理论依据,关键技术以及难点。将深度学习中的降噪自编码器模型与强化学习中的Q学习模型相结合,解决了强化学习应用于复杂交通系统中产生的状态空间爆炸问题,有效提高了算法对交通异常数据的处理。2.在基于深度强化学习的交通信号控制策略的基础上,对于城市道路系统中的单个交叉口考虑相位顺序对交叉口控制效果的影响,进行了相位顺序与信号配时策略协同控制系统的研究。对于城市道路区域交通控制系统,提出了基于分布式多智能体系统的区域交通信号控制策略,保证了区域交通分级控制的实时性和可靠性。3.搭建了Python-VISSIM在线交通仿真平台。该平台可以采用Python编写的自定义交通信号控制算法,通过VISSIM自带的COM接口,对VISSIM中的交通模型对象进行访问和改变,并对收集到的数据进行整理和可视化处理。仿真结果显示,当交通场景简单及交通量稳定时,应用了改进算法的交叉口的车辆平均延误低于应用传统深度强化学习算法的交叉口的平均延误,算法应用的实时性和准确性得到优化,但并不比应用了固定信号配时算法的交叉口的延误小;当交通场景复杂,如相位数量增多或交通流量变化幅度较大时,交通异常数据对信号控制效果的影响被放大,降噪自编码器的作用开始展现,本文所提出的控制策略的控制效果明显优于传统的深度强化学习控制策略和固定配时控制策略。
其他文献
美国利益集团的历史由来已久。在美国政治生活中,它不仅介入司法、行政和立法过程,还以各种手段影响联邦政府政策的制定和法律的出台,可以说利益集团的身影无处不在。因此,要
股利是公司向股东分配资金的最主要机制。然而目前,仍存在大量研究学者并未解决的问题:股利之谜。文章回顾了股利支付及股份回购的理论和实证研究的相关文献,用市场的不完全
在党的十八届三中全会通过的《中共中央关于全面深化改革若干重大问题的决定》中,提出了“推进国家治理体系及治理能力的现代化”的总目标。党的十九大报告则进一步提出“打
个人经营性贷款是解决中小企业贷款难的一个有效突破口,但也是风险系数较高的贷款业务。在开展个人经营性贷款业务时,银行对其风险的监控提出了更高的要求,而贷款的事前审查
探明毛竹生物量分配格局及其随个体大小的变化规律,有助于揭示毛竹生物量的种内变异规律,从而能够进一步提高毛竹生物量及其碳储量的估算精确度;同时也有助于指导毛竹林定向
我国《公司法》设立的人格否认制度绝对高度汇聚了立法者的才智,该法单单是用第20、64两项文款,统共只有寥寥数字汇精凝神,就架构了一项非常重要的制度。该制度是对整部公司
借助网络和科技的力量,近年来金融行业构建起以资源共享、要素共享、利益共享为特征的金融模式。这种以互联网金融为主的共享金融模式使得金融资源得以更有效地配置,金融产品和
报纸
以罗非鱼骨为研究对象,研究其胶原蛋白酶解为胶原多肽的工艺。通过单因素和正交试验,以水解度和胶原蛋白提取率为考核指标,确定了酶解罗非鱼骨的最佳用酶为碱性蛋白酶,最佳工
苏州园林源远流长,明清全盛时500多处园林遍布古城内外,直至今日保存完好的尚存数十处,分别代表了宋、元、明、清南方园林风格,在城市里创造了人与自然和谐的境界。1997年12月,联
人人网的应用内容丰富,已经成为当前上海青少年频繁开展网络社交活动的社交平台,网络社交逐渐取代传统社交成为了青少年社会化过程中重要的一环。本文以上海青少年网络社交行