多智能体情感决策学习方法及其在Flow智能交通中的应用

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:lishuangjie2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的计算机技术已经满足不了人工智能的发展需求,人们迫切需求更加智能的决策学习方法来解决各种复杂问题。分布式技术使得智能体(Agent)之间可以相互协作和学习,处理复杂决策问题的能力大大提升,已成为智能控制领域的研究热点。然而,多智能体(Multi-Agent)在完成需要频繁交互的决策任务时,普遍存在学习能力差、偏好评估和群体一致性较低等问题。近年来,情感计算以其可以量化展示群体智慧的涌现过程和决策一致性的收敛过程的优势,为解决这类复杂决策问题提供了一种新方法。目前针对情感计算的研究主要集中在情感识别和表达,鲜有探讨如何利用情感机制来进行更好的决策。此外,智能体的发展局限于逻辑推理能力的改进,很少涉及个体情感变化和群体情感交互。值得一提的是,面向大规模多智能体的系统建模问题时,情感机制的反馈会有助于更好地评估当前的环境并帮助智能体做出有利的决策,使得系统更加智能,决策更加高效。为此,本文提出了一种情感交互机制下的多智能体决策学习方法,构造了融合决策偏好的多层情感计算模型,给出了智能体情感变化和行为偏好之间的映射关系;然后,定义了一种新型的决策一致性指数和方案决策熵,以此体现决策的收敛过程和群体一致性,并通过数值实例证明在解决传统群决策问题上的可行性和优势;最后,给出了强化学习框架下的智能体内部情感奖励函数的定义,建立了 一类情感驱动的强化学习模型。将所提决策学习方法应用于Flow智能交通控制平台,对比传统的交通控制和强化学习方法,本文所提情感交互式决策方法可以提高Flow平台中智能体的学习速度和交通流畅度,对于强化学习在复杂场景普遍存在的奖励稀疏问题也有明显改善。本文工作为传统群决策问题提供了一种群体情感交互决策方法,同时基于Flow智能交通系统建立了一种情感驱动下的多智能体强化学习方法,这为未来城市智能交通系统的构建找到了一条新的途径。
其他文献
生物柴油作为柴油的代替产品,在能源化工行业具有普遍的应用。传统的以脂肪酸甲酯为主要成分的一代生物柴油存在诸多的缺陷,而经过加氢裂解工艺制备的第二代生物柴油逐步成为热点。本文主要研究制备生物柴油的加氢裂解工艺的反应条件,催化剂载体选择、不同金属负载等对油脂加氢裂解催化性能的影响。主要有以下结果:1通过考察不同反应温度和不同反应时间下反应产物的分布以及主要产物轻组分油的质量、得率以及其中正构烷烃的含量
近年来,互联网经济迅速发展,市场主体的垄断行为不再局限于传统经济领域,国内外互联网行业反垄断纷争迭起。相关市场界定是反垄断的起点,但是由于互联网行业具有“双边市场特
非认知能力作为人才能力结构中的重要组成部分直接决定了个人能否实现其长远的目标从而取得成功,对我国的劳动者而言,非认知能力对其职业发展的重要性和现实意义也日渐突显出
党的十八大以来,以习近平为核心的党中央十分重视中国优秀传统文化。习近平在坚定的马克思主义信仰基础上,继承了中国共产党的传统文化思想,形成了独具特色的习近平传统文化
步态识别技术是近年来计算机视觉和生物识别领域的研究热点,旨在根据人类走路的姿态对个体身份进行识别。相比于其他的生物特征,步态是唯一远距离可感知的生物特征,具有难以
近些年,最优分红问题是保险精算研究的核心内容,它在保险和金融领域中一直备受学者的广泛关注.常见的分红策略有很多,其中周期分红因其更加符合公司运营的实际情况,成为当前
足球场草坪是开展足球运动的场地,其必须承受高强度的践踏要求。很多运动场都会采用沙质坪床进行坪床建造,但其保水保肥能力较弱,导致后期养护管理难度增大,坪床质量下降。为
目的:观察老年2型糖尿病患者在不同肾功能分期的中医证候分布特点,探寻疾病证候的演变规律以及各证型与相关实验室指标的关系。方法:收集2018.01——2019.01期间成都中医药大学附属医院内分泌科及肾病科300例60岁及以上老年2型糖尿病住院患者的临床资料及中医证候等信息,进行统计分析。结果:1、300例老年2型糖尿病患者中男性149例,女性151例,男女之比为0.98:1;95.3%的患者为汉族
莲花荡水系和大港河是宜兴市丁蜀镇两条入太湖河流。近年来,莲花荡水系和大港河水环境状况不断恶化2015年莲花荡水系、大港河开展了集约化畜禽养殖整治、清淤工程。为了系统
混合草坪植丝模式是指为结合人造草坪与天然草坪两者优点,通过专业机械设备将人造草丝纤维植入天然草坪的一种混合草坪建植技术。本研究通过对高羊茅(Festuca arundinacea Sc