网联环境下基于深度强化学习的单路口交通信号控制优化

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:johnwangjohn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度强化学习能为交通信号控制研究带来诸多优化空间,它能够实现Agent与道路交通环境之间的交互,根据获得的惩罚或奖励不断地学习知识,从而更加适应环境。研究主要是基于深度强化学习和SUMO仿真的方法,以从仿真的方式建立的智能网联车辆环境中得到单路口交通实时动态信息,并从中输出深度Q网络(DQN)算法所需要的重要参数。基于搭建的深度神经网络,通过不断优化它的权重参数来提高性能,进一步实现对单路口交通信号控制方案的优化,并最终探索一个能够通过自主学习来高效控制单路口交通的信号控制方案。
其他文献
随着生态环境恶化,绿色生产和绿色消费问题已成为全人类共同关注的话题。酒店行业能源消耗巨大,造成了生态环境的恶化。消费是生产的动力,我国居民的绿色消费水平还比较低,消
爆炸危险区域划分的目的是为了正确地选择防爆电气设备,企业防爆电气设备的日常维护也涉及选型工作。为了帮助设计人员和企业防爆电气维护人员正确选择防爆电气,本文基于防爆
今年,地处甘肃陇南深山的农民,借助"小喇叭"、无人机等设备智能耕作,降低了因"土法"务农带来的损失,解了他们的心头难事。陇南成县白马寺村的王录今年46岁,祖辈务农。令他一
头孢曲松钠可致迟缓型过敏反应。为避免迟发性过敏反应的发生,静滴时头孢曲松钠浓度不宜过高,速度不宜过快,要加强监护、严密观察,一旦有异常发生,立即中止输入,并对症处理,防止严重
随着人工智能的发展,人机交互技术在不断进步,为使人机交互更加友好,情绪识别技术被广泛关注。情绪是一个人内心的感触的体现,可以体现在面部、语音、脉搏等多方面。实验室环
随着智能小车技术的发展,对智能小车控制器的研究也有了更多的现实意义。针对智能小车轨迹跟踪问题,提出一种多维泰勒网优化控制器。首先,为智能小车构建数学模型,并据此设计
中铁检验认证中心(CRCC)是经国家认证认可监督管理委员会批准,具有第三方公正地位的产品认证机构,批准号为CNCA-R-2002-102。CRCC在国家认监委批准的范围内,按照国际通行认证模
<正>乙型肝炎病毒(Hepatitis B Virus,HBV)是已知的引起人类疾病的最小DNA病毒,HBV感染呈世界性分布,许多慢性感染者演变成慢性活动性肝炎、肝硬化、肝癌,威胁人类健康。过去
对两段式生物质气化技术中部分氧化段进行数值模拟。模拟不同当量比对生物质气化产气中焦油部分氧化的影响,选取甲苯、苯酚、萘作为焦油模型化合物,建立了反应区的数值模型。
以直升机为研究对象,提出多维泰勒网(MTN)优化控制方案,实现了直升机姿态和轨迹的控制。首先使用Matlab搭建直升机的数学模型;然后设计PID控制器,建立了仿真系统;最后使用Mat