一种基于角色跟踪的群体Agent再励学习算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:hheeuuuu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多Agent系统中,通过学习可以使Agent不断增加和强化已有的知识与能力,并选择合理的动作最大化自己的利益.但目前有关Agent学习大都限于单Agent模式,或仅考虑Agent个体之间的对抗,没有考虑Agent的群体对抗,没有考虑Agent在团队中的角色,完全依赖对效用的感知来判断对手的策略,导致算法的收敛速度不高.因此,将单Agent学习推广到在非通信群体对抗环境下的群体Agent学习.考虑不同学习问题的特殊性,在学习模型中加入了角色属性,提出一种基于角色跟踪的群体Agent再励学习算法,并进行了实
其他文献
联盟是多Agent之间一种重要的合作方法,如何生成面向某个任务的最优联盟是一个复杂的组合优化问题.首次引入蚁群算法来解决这一问题,在求解过程中蚂蚁倾向于选择曾经合作过并
通过对施工项目成本管理的内容、特点进行分析,并根据施工项目成本控制的特点,对项目成本管理与控制中存在的问题进行了探讨。
《平法》教学中,钢筋的位置有上有下、有贯通的、有非贯通的、搭接位置有端部、有跨中等,钢筋位置的复杂性给中职学生学习带来很大的困难,如能将《力学》与《平法》结合起来,
对自卸汽车举升机构拉杆的加工工艺进行改进,采用钻铰加工工艺来代替钻镗加工工艺,提高了加工效率、降低加工成本,并能保证零件加工精度合格。
混凝土工程是建筑工程的重要组成部分,因此混凝土的质量控制在施工中尤为关键。文章从原材料的质量控制、混凝土的配合比、混凝土的和易性、混凝土浇筑振捣的过程、预防混凝
首先给出了一个两层结构的混合实时数据库系统模型,其中支持采用非定期任务调度算法来改进系统的性能.进一步,针对这种模型下混合事务的数据一致性问题,提出了一种新的并发控
由于稀疏天线阵列所具有的特性,使其正得到日益广泛地应用,但是稀疏阵方向图却具有栅瓣。文章针对如何通过适当地选取稀疏天线阵列的阵元位置来最大限度地抑制阵列的栅瓣这一综
“特级教师”是国家为了表彰特别优秀的中小学教师而特设的一种既具先进性、又有专业性的称号。特级教师是师德的表率、育人的模范、教学的专家。中小学评选特级教师工作始于
对数变换器是对数乘法器的重要组成部分,它们以精度换取更快的速度.设计并实现了一种基于FPGA的32位二进制对数变换器,主要由先导“1”检测电路、移位逻辑和误差校正电路组成