基于Q学习的Agent在单路口交通控制中的应用

来源 :公路交通科技 | 被引量 : 0次 | 上传用户:PILIYADAN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数。即当红灯相位的饱和度大于绿灯相位的饱和度时,红灯相位的相对警界度在奖惩函数中占主导地位,此时大部分情况下会对Agent进行惩罚;在以后的决策过程中面对类似的交通状态Agent所选择的控制行为更倾向于将通行权切换给下一个相位,反之,Agent所选择的行为倾向于保持当前相位的通行权到下一决策时刻。并通过微观交通仿真
其他文献
《邀舞》是德国作曲家韦伯(1786—1826)浪漫主义时期的音乐作品,整首乐曲技巧华丽,形象鲜明。钢琴曲《邀舞》是作曲家韦伯最有名气的作品之一,《邀舞》这部作品无论从风格、
劳务派遣,在我国又称劳动派遣、劳动力租赁。是指由作为派遣机构的劳务公司与被派遣劳动者建立劳动关系,双方签订劳动合同。而后劳务公司将劳动者派遣到实际用工单位,劳动者在实
文冠果是我国特有的植物,以朝阳地区文冠果为研究对象采用不同的嫁接方法及接穗类型,研究嫁接后对成活率的影响。结果可知:四种嫁接方法中髓心形成层贴接和腹接法的嫁接成活
世界上任何语言都根植于特定的民族文化背景之中,反映着特定的文化内容。语言是文化的载体,也是民族文化的镜子;成语是语言的重要组成部分,具有很强的民族性,是民族历史的映
突如其来的"非典"疫情,成为今春以来困扰我国社会、经济和人们生活的严重问题.由于人类缺乏对新病毒的了解,致使人们一度对"非典"疫情的肆虐产生了较大的恐慌.一时"非典"的负
目的观察外源性Apelin-13对自发性高血压大鼠(SHR)心肌肥厚的影响,并初步探讨其作用机制。方法将24只20周龄雄性SHR随机分为空白对照组(NTC)、硝苯地平组(NIF)、Apelin-13组(Apelin-
依照军队和地方各级组织的要求和关心,今年我离开了工作多年的部队,来到省林业厅工作,在组织和行政程序上完成了工作的二次的转变。但是面对新的工作环境和工作方式,我感到无所适
指出了榧树是集药用、果用、油用、材用、观赏和环保等多种用途于一身的珍贵经济树种。为了解决云南榧树有性繁殖不能保持良种特性,而现有扦插技术生根困难的问题,首次提出了