论文部分内容阅读
近年来,不断发展的交通信号控制技术有效地解决了部分的城市交通拥堵问题。随着出行模式、驾驶行为以及道路基础设施等方面的变革使得信号控制技术的研究进入了智能化的研究阶段,互联网技术的广泛应用以及大数据、5G、AI等更加准确的感知新技术的飞速发展更为交通信号智能化控制研究提供了数据和平台。将路口作为智能节点,交通区域依据交通流的实时变化自主决策控制,是当前交通信号控制领域急需解决的难题之一,因此以智能体技术为载体研究人工智能信号控制算法已经成为了当前研究的热点方向。本文以网联环境下交通数据的应用为核心建立可以与环境进行交互的信号控制交叉口智能体模型,分析信号控制区域内各个交叉口之间的博弈关系,构建一种以多智能体技术为载体、基于人工智能控制算法的区域交通信号协调控制方法,最终提升整个路网的信号控制效果及运行状态。论文主要工作包括:第一,单交叉口智能控制方法研究。交叉口是信号控制最基本的控制单元,是区域交通协调控制的前提条件。本文通过交叉口采集的网联数据与信号控制器之间的交互,基于深度强化学习研究控制优化算法,构建信号控制交叉口智能体。采取多重指标权重分析法来构建交叉口智能体的状态空间,使模型的状态空间更加贴近实际交通环境。进一步构造了模型的动作相位、奖励函数以及动作选择策略,采用DRQN网络模型进行训练,运用循环神经网络LSTM的记忆能力提升了网络模型的优化效果。通过Python语言设计算法并搭建了Vissim交通仿真平台,实验结果表明,采取优化算法后交叉口的排队长度和车辆延误有了小幅优化第二,区域交通智能协调优化控制技术研究。交通组织优化是提升区域交通运行状态的最基本手段,本文对中关村西区进行了交通组织优化研究,将博弈论与Dyna算法框架引入多智能体结构模型研究了区域交通协调控制算法,将区域路网模型分为两个层次,上层为交通子区智能体,下层为交通子区内的信号控制路口智能体。针对交通子区智能体,将Dyna算法框架与Q学习相结合提出了基于Dyna-Q的交通子区协调控制算法。针对交通子区内的信号控制路口智能体,引入Stackelberg博弈,构建了基于Stackelberg-Q的交通子区内部控制算法。采用Synchro交通仿真软件分别对路网的交通组织优化效果和区域交通智能协调优化控制算法的控制效果进行了仿真试验,实验结果表明,与优化前的交通组织相比,路网运行状态得以提升,与传统的基于专家系统的大周期固定配时方案相比,本文提出的区域交通智能协调优化控制算法将路网的控制效果进行了小幅提升。