基于强化学习的多Agent系统规划规则抽取方法

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:javaoak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习和规划技术在目标上有着很高的相似性,而在技术上又具有互补性,因此,基于强化学习的Agent规划规则抽取问题长期以来一直是研究的热点。针对基于强化学习的多Agent系统在规划规则抽取方面存在的问题,提出了一种从多Agent Q学习中抽取满足规划条件的规划规则的RL—MAPRE算法,并给出了理论分析。
其他文献
采用X-射线衍射仪(XRD)、扫描电子显微镜(SEM)、电池性能测试仪等系统分析了Pechini法合成的LiM。Mn2--xO4(M—La,Ce,Nd;x=0,0.02,0.03)的结构、形貌、首次充放电及循环稳定性等。结果表明
目的 观察复方甘草酸苷联合西替利嗪治疗单纯型过敏性紫癜的临床疗效.方法 采用随机对照法将175例患者分为治疗组95例和对照组80例.两组均口服西替利嗪、VitC、VitE及双嘧达
王力虎,男,汉族,1962年4月生,山西文水人,广西师范大学教授,博士。1984年9月于华中师范大学物理系毕业获学士学位,进入广西师范大学物理系任教,2000年9月-2001年7月赴南京大学计算机
目的 掌握和了解我省麻风的畸残情况,有助于比较各地的麻风畸残情况和制定相应的康复计划,降低畸残率。方法参照国家规定的有关分级标准,对青海麻风防治历年各种统计表等资料
痤疮是发生于毛囊皮脂腺的一种慢性炎症性疾病。主要发生于面、胸背等处,形成黑头、丘疹、脓疱、结节等损害。原发性痤疮好发于青年人,严重影响美容,给患者带来苦恼。我科于2010
目的 观察5-氨基酮戊酸光动力疗法(ALA-PDT)治疗泛发性跖疣的临床疗效.方法 对28例泛发性跖疣患者进行ALA-PDT治疗.结果 经过(3~4)次ALA-PDT治疗后,随访3个月,26例泛发性跖疣患者
将粒子群优化算法用于前向神经网络权值的学习算法研究,以神经网络学习算法研究的典型问题之一的XOR问题作为研究实例,针对算法的收敛性、学习速度以及算法对初值的鲁棒性等性
构造程序语言的部分计值器时最重要的一步是约束时间分析.当已知程序的部分输入时,约束时间分析阶段是区分程序中哪些计算可在部分计值时完成,哪些计算须在运行时完成.然而对
针对QM(定性映射)模型提出了一种新的应用推理.给出了QM模型如何学习、如何应用的具体实施算法,并在此基础之上,探讨了辅助风险决策方面的应用.
目的 总结分析绞窄性粘连性肠梗阻的成因和诊断治疗。方法 回顾分析1990~2000年内收治的38例绞窄性粘连性肠梗阻病例。对其发生原因、诊断体征和治疗作了比较分析。结果 38例
期刊