多智能体深度强化学习研究综述

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:tomzhang155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多智能体深度强化学习是机器学习领域的一个新兴的研究热点和应用方向,涵盖众多算法、规则、框架,并广泛应用于自动驾驶、能源分配、编队控制、航迹规划、路由规划、社会难题等现实领域,具有极高的研究价值和意义。对多智能体深度强化学习的基本理论、发展历程进行简要的概念介绍;按照无关联型、通信规则型、互相合作型和建模学习型4种分类方式阐述了现有的经典算法;对多智能体深度强化学习算法的实际应用进行了综述,并简单罗列了多智能体深度强化学习的现有测试平台;总结了多智能体深度强化学习在理论、算法和应用方面面临的挑战和未来的发展
其他文献
为明确烟草根系分泌物对烟草疫霉菌的影响,采用液相色谱-质谱联用仪(Liquid chromatograph-mass spectrometry,LC-MS)检测小黄金1025和革新3号根系中共有分泌物含量的变化。
笔者在近5年临床诊病过程中,外用三七叶治疗单纯疱疹50例,取得较好疗效,现总结报告如下.1临床资料本组50例患者中,男32例,女18例;成人40例,儿童10例.发病部位:常见于口唇周围
目的探讨高频彩色多普勒超声与超声引导下穿刺活检(US-CNB)对乳腺小肿块的诊断价值。方法收集乳腺小肿块(直径≤2.0cm)患者89例(恶性47例,良性42例),分析比较高频彩色多普勒
文[1]首先分析了Δ法求圆锥曲线过一点切线方程的不足,然后介绍了借助构造关于给定点对称的曲线求过一点切线方程的方法.受文[1]的启发,笔者对求这一点切线方程这类问 The p
为探究林农种植能源树种意愿的影响因素及行为机理,基于福建省建宁县的调研数据,运用二分类Logistic回归模型对林农种植能源树种意愿的影响因素进行了实证分析.研究结果表明,
民俗是广大民众在生存活动中创造出来的具有物质与精神两栖性的生活文化.它的鲜丽的形式结构承载着人类的善真追求,表现出美的特性.尤其是人生民俗和信仰民俗的超越性功能,更
目的 探讨临床表现急性早幼粒细胞白血病 (APL)明显特征而核型分析正常或非典型t(15 ;17)患者是否伴有分子异常及荧光原位杂交 (FISH)技术在APL诊断中的应用价值。方法 应
目的探讨分析护理风险管理在内镜下逆行胆胰管造影术护理中的效果。方法选取2017年1月至2018年12月我院需行内镜下逆行胆胰管造影术的60例患者,随机分为试验组和对照组,每组
<正>为了贯彻落实《长三角质量技术监督合作互认宣言》,推进长三角地区(江苏省、浙江省、上海市,以下简称两省一市) 农业标准化向更深层次发展,促进农业增效、农民增收、农村
会议
【正】 从本世纪初起,东南亚华侨华人就已成为中国学者研究的对象。①中国的“文化大革命”使这些研究中断了十几年。然而,在中国政府于70年代末宣布实行开放政策后不久,在一