基于深度强化学习的城市智能交通信号控制算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cngd0613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市交通拥堵问题日益严重,智能交通信号控制技术作为缓解交通拥堵最有潜力的方法之一,受到了国内外广泛的关注。由于交通系统具有复杂性、动态性和非线性的特点,基于对交通系统建模的传统自适应交通信号控制算法,已经不能应对日益多变的交通流。针对这一问题,有学者提出了基于强化学习的交通信号优化控制算法,因为强化学习方法不需外界环境的具体模型,通过不断地与外界进行交互,试错学习,实时调整策略,可以在复杂交通系统中取得很好的控制效果,成为近年来研究的热点。本文基于深度强化学习算法设计了城市智能交通信号优化控制算法,本文的主要工作如下:
  (1)提出了一种基于深度强化学习算法的单交叉口信号优化控制算法,强化学习智能体感应交叉口的交通状态,实时调整信号控制方案。本文提出的算法相较于目前大多数信号控制算法,不仅可以灵活切换相位,在算法中增加了切换相位前需黄灯警示的步骤,提高了安全性;而且定义的状态维数低,但包含了绝大部分交通信息,使得强化学习模型能很快收敛,为在路网信号控制方案的设计打下了基础。仿真结果表明,该算法相比于固定配时法,可有效减少交叉口54.07%的车辆平均等待时间。
  (2)设计了基于中心智能体的路网信号优化控制算法,中心智能体感应整个路网交通状态,实时调整所有交叉口的信号方案。在该算法中,将状态定义为所有交叉口的入车道的道路排队长度、车辆数目和车辆速度,将动作定义所有交叉口下一时间间隔的相位方案。提出的算法只需配备一个中心服务器,交叉口间不需要进行通信,应用成本低,适用于中小型路网。仿真结果表明,该算法可以有效减少路网中车辆的平均等待时间,相比于固定配时法提升效率高达55.98%。
  (3)针对大规模路网场景,提出了基于多智体的路网信号优化控制算法,解决了大规模路网场景中的状态空间和动作空间维数巨大,强化学习模型难以收敛的问题。该算法的核心是:每个交叉口都由本地智能控制,本地智能体不仅感应本地交通状态,同时通过获取全局相位方案来感应整体交通状态;并且在智能体的奖励函数中增加了相邻交叉口的累积等待时间,从而使得交叉口智能体之间协调优化,高效的寻找最佳路网信号控制方案。本文的算法具有良好的扩展性,可以扩展到各种规模的场景中,同时智能体的计算成本不会随之变化。仿真结果表明,在大规模路网场景下,该算法相比于固定配时法和中心智能体算法可以有效减少78.26%和32.98%的车辆平均等待时间。
  本文的研究针对不同场景,从设计智能交通信号控制算法的角度,进一步挖掘现有交通系统的供给潜力。仿真实验结果表明,在单交叉口、小规模路网、大规模路网和真实路网数据的场景下,本文提出的算法均可以有效地降低区域内车辆的平均等待时间,缓解城市拥堵,提升个人驾车体验,为推动城市交通智能化做出了一定的贡献。
其他文献
【摘要】以十九大重要精神为引领,加快各行业转型升级,提高发展质量和效益,为中国特色社会主义现代化强国建设添砖加瓦,是未来各行业长期的政治任务和战略重点。内河水运作为与经济全球化接轨最早的行业,在“一带一路”倡议指导下,应加快供给侧结构性改革,加快转型升级,加快自身服务质量和服务效率提升,发挥在“交通强国”建设中的引领作用,促进国家战略深入实施,打造全球航运物流服务网络,为我国成为制造强国、贸易强国
期刊
【摘要】水利水电工程建设中的围堰作用主要是防止水利水电工程在施工过程中受到水的干扰,并且围堰施工可以实现泥土和水的分离,因此为了充分发挥其所具有的功能,本文阐述了水利水电工程建设中的主要围堰结构形式,对水利水电围堰施工要点及其策略进行了简要分析。  【关键词】水利水电工程建设;围堰结构形式;围堰施工要点;策略  一、水利水电工程建设中的主要围堰结构形式  水利水电围堰结构形式主要有:(1)土石围堰
期刊
自动调制识别(Automatic Modulation Classification, AMC)是指在没有或者缺乏调制参数以及链路特性等先验信息的条件下用于评估未知信号调制类型的一种信号处理技术,在电子侦察、通信对抗、干扰识别、频谱监测等军事和民用领域有着广泛的应用。近年来,随着无线通信技术的迅猛发展,信号调制方式日益增加,信道传输环境也日趋复杂,这极大的增加了调制识别的难度。为此,如何设计一种高效的调制识别方法成为无线通信领域亟待解决的难题。
  本文致力于对多种调制类型、强干扰信道条件下的无线通
【摘要】由于在运用电动机时被较多因素所干扰,比如影响电动机的内部以及外部因素,进而发生故障问题,不但对设备的正常运行造成极大的影响,并且还影响了工业企业的正常生产活动。近年来,我国电力行业得到快速提升,很大程度的提高了电动机的制备能力,并且其质量也不断提升,从而降低了电动机运行过程中的故障。但是,目前在电动机运行过程中依然存在一定的故障,从而一定程度的阻碍着生产活动的进行。本文就通过介绍交流异步电
期刊
正交时频空(Orthogonal Time Frequency Space, OTFS)调制技术为处理时变多径信道中的高多普勒频移问题提供了巨大的潜力,其关键思想是将时频域内随机衰落的信道转换成时延-多普勒域中稳定非衰落的信道,从而使得每个信息符号都会经历恒定的平坦衰落。本文致力于采用仿真的方法对水声OTFS通信系统进行研究,同时基于统计水声信道模型与Watermark(Underwater Acoustic Channel Replay Benchmark)实测信道数据分析OTFS调制技术应用于水声通信
深度学习技术的发展,为各行各业带来了蓬勃的生机。特别是语音合成技术中,深度学习取得了巨大的成功。以Tacotron为首的端到端的语音合成技术使构建语音合成系统变得更加简单的同时,也使得合成的语音具有更高的可懂度和自然度。今天,语音已经逐渐的走入了我们的生活中。各种语音助手、语音交互功能方便着我们的生活。目前的语音合成技术依然存在瓶颈,还是停留在能发出人类听得懂的声音这个阶段,还无法实现情感的表达,无法像人一样进行生动的演说。这一点是目前制约着语音合成系统迈向更广泛应用的关键。于此同时,端到端的语音合成系统
【摘要】依托某水电站混凝土施工项目,不仅通过选用合理的模板选型、混凝土配合比、混凝土入仓手段和施工仓面设计、浇筑过程、养护等进行规划,而且还要就清水混凝土施工质量、机械化操作水平、作业情况,以及施工养护情况等进行对比性分析,进一步对清水混凝土技术要点进行探究和分析。  【关键词】水电站;清水混凝土;施工技术;应用  一、项目概述  地下廠房布置于左岸山体内,纵横线方向N55°E,最小水平埋深约36
期刊
非侵入式负载监测通过单一传感器有效准确地监测住宅单个电器设备的能源消耗,对全球关注的节能减排问题有着至关重要的效用。除此之外,非侵入式负载监测还能有助于优化智能电网的能源管理,改进家电设计,提升运作效率。传统的负载监测方法存在着分辨率低和实时性差的弱势,特别是在家居智能化的多变场景下,既有的算法模型无法满足高精度和强迁移性的要求。
  深度学习在相关问题中表现良好,特别是对于数据量庞大的样本,可以有效进行特征提取,避免繁杂冗余的数据建模,基于高效的深度神经网络,本文提出了跨场景的实时非侵入式负载监测
近年来,随着移动手机等智能终端的普及和移动计算技术的发展,位置服务(Location Based Service,LBS)越来越受到人们的青睐,它给人们带来方便的同时,也增加了隐私泄露的风险,攻击者可以很轻易地从位置信息中提取出用户的家庭地址、健康状况、收入等信息。目前用户位置隐私泄露的途径主要有两种:(1)某些组织或机构为了科研目的公开用户的位置数据,攻击者获取这些数据后,采用大数据等相关技术,挖掘出用户的隐私信息;(2)用户在接受位置服务时,受到攻击者攻击,导致隐私泄露。因此开展LBS中用户隐私保护技
【摘要】在大型水利水电工程项目管理过程中,其涉及的范围十分广泛,因此,必须从多个角度加以考虑。本文以大岗山水电站项目为例,具体分析与阐述了大型水利水电工程项目的管理方法。  【关键词】水利水电工程;项目管理;管理方法  1、引言  结构复杂、位置固定、形式多样、体积较庞大等均为大型水利水电工程的特点,同时,大型水利水电工程的施工周期较长、涉及到的资源种类繁多及用量较大、空间流动性较高。因此,大型水
期刊