【摘 要】
:
针对复杂的、难以建模的城市交通系统,将多步强化学习算法SARSA(λ)应用于交通信号控制,根据实时的交通状态信息动态进行决策,自动适应环境以便取得更好的控制效果。由于问题状
论文部分内容阅读
针对复杂的、难以建模的城市交通系统,将多步强化学习算法SARSA(λ)应用于交通信号控制,根据实时的交通状态信息动态进行决策,自动适应环境以便取得更好的控制效果。由于问题状态空间太大而难以直接存储和表示,采用径向基函数神经网络进行值函数近似,通过训练自适应非线性处理单元,可达到较好的近似表示效果,解决了单个十字交叉路口的交通信号控制问题。对该方法进行仿真实验,结果表明其控制效果明显优于传统的固定配时控制策略。
其他文献
应用对中国不同地区和类型高校2507名大学生的调查数据,应用路径分析方法检验了Richardson提出的关于学生的背景、感知的学习环境、学习行为和学习产出之间关系的理论模型,评
<正> 以1987~1991年间,在富山医科药科大学附属医院和汉诊疗部就诊的患者中,经上消化道内窥镜及X线检查未见溃疡、糜烂、浅表性胃炎,腹部超声检查无形态学异常(包括
<正>多年来,雅纳切克写给卡米拉·斯托斯洛娃(Kamila Stosslova)的信被视为"不能言说的话题"。众所周知,捷克作曲家晚年与这位年纪比他小一半的女士维持着相当亲密的关系,卡
激发学生学习美术的兴趣是初中美术教学的重要内容。文章从教师的自身魅力、课堂导入、游戏教学、多媒体和联系生活实际五个方面简要论述了一些激发学生学习兴趣的教学方法,
《国家中长期教育改革和发展规划纲要(2010—2020年)》指出,"树立科学的质量观,把促进人的全面发展、适应社会需要作为衡量教育质量的根本标准"。学生的核心素养是我国建立教
滞环比较方式是PWM控制的常用方式,对电流滞环比较PWM控制方式的原理进行分析,总结电流滞环比较方式的优缺点。为了提高三相PWM整流器的电流跟踪性能,减少开关频率及开关损耗
<正> 改编(arrangement),古已有之。巴赫的作品目录中便有许多改编曲。他改编别人之作,相当自由,自由到为后人所不敢。维瓦尔第有十六首小提琴协奏曲被他改为古钢琴曲。有三
<正>从1924年开始,雅纳切克与卡米拉之间的亲密关系有了进一步的发展,原先刻意设置的障碍感已荡然无存……卡米拉致雅纳切克,皮塞克,1924年7月25日昨晚我梦见了你,醒来时连自
<正> 随机选择各类疾病患者122例(男48例,女74例,平均年龄55.2岁),通过问诊及查体对其症状、体征作出评估,同时拍下舌像。然后依据寺泽的气虚、气郁、气逆、血虚、血瘀、水湿
深部低渗松软煤层群煤层气抽采面临着高地压、低渗透、难抽采等难题,通过分析现有煤层气抽采技术的特点,给出了煤层群开采条件下的煤层气抽采技术分类方法。基于保护层与被保