基于强化学习的多Agent系统规划规则抽取方法

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户：javaoak

【摘要】

：

强化学习和规划技术在目标上有着很高的相似性，而在技术上又具有互补性，因此，基于强化学习的Agent规划规则抽取问题长期以来一直是研究的热点。针对基于强化学习的多Agent系统在

【作者】

：

赵志宏黄蕾刘峰骆斌

【机构】

：

南京大学软件学院

【出处】

：

广西师范大学学报(自然科学版)

【发表日期】

：

2008年1期

【关键词】

：

强化学习多AGENT系统规划规则抽取 reinforcement learning multi-agent system planning rul

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化学习和规划技术在目标上有着很高的相似性，而在技术上又具有互补性，因此，基于强化学习的Agent规划规则抽取问题长期以来一直是研究的热点。针对基于强化学习的多Agent系统在规划规则抽取方面存在的问题，提出了一种从多Agent Q学习中抽取满足规划条件的规划规则的RL—MAPRE算法，并给出了理论分析。

其他文献

稀土掺杂锂电池正极锰酸锂的合成及电化学性能

采用X-射线衍射仪（XRD）、扫描电子显微镜（SEM）、电池性能测试仪等系统分析了Pechini法合成的LiM。Mn2--xO4（M—La，Ce，Nd；x=0，0．02，0．03）的结构、形貌、首次充放电及循环稳定性等。结果表明

期刊

稀土掺杂锰酸锂Pechini方法结构性能rare earth doped lithium manganate Pechini method s

复方甘草酸苷联合西替利嗪治疗单纯型过敏性紫癜疗效观察

目的观察复方甘草酸苷联合西替利嗪治疗单纯型过敏性紫癜的临床疗效.方法采用随机对照法将175例患者分为治疗组95例和对照组80例.两组均口服西替利嗪、VitC、VitE及双嘧达

期刊

单纯型过敏性紫癜复方甘草酸苷西替利嗪疗效

《广西师范大学学报：自然科学版》编委——王力虎教授简介

王力虎，男，汉族，1962年4月生，山西文水人，广西师范大学教授，博士。1984年9月于华中师范大学物理系毕业获学士学位，进入广西师范大学物理系任教，2000年9月-2001年7月赴南京大学计算机

期刊

广西师范大学自然科学大学学报系统分析与集成编委华中师范大学博士学位虎

青海省麻风畸残流行病学分析

目的掌握和了解我省麻风的畸残情况,有助于比较各地的麻风畸残情况和制定相应的康复计划,降低畸残率。方法参照国家规定的有关分级标准,对青海麻风防治历年各种统计表等资料

期刊

麻风畸残流行病学

中药内服与红蓝光照射治疗痤疮40例疗效观察

痤疮是发生于毛囊皮脂腺的一种慢性炎症性疾病。主要发生于面、胸背等处，形成黑头、丘疹、脓疱、结节等损害。原发性痤疮好发于青年人，严重影响美容，给患者带来苦恼。我科于2010

期刊

蓝光照射治疗痤疮患者中药内服疗效观察慢性炎症性疾病毛囊皮脂腺疗效满意青年人

5-氨基酮戊酸光动力疗法治疗泛发性跖疣28例疗效观察

目的观察5-氨基酮戊酸光动力疗法（ALA-PDT）治疗泛发性跖疣的临床疗效.方法对28例泛发性跖疣患者进行ALA-PDT治疗.结果经过（3~4）次ALA-PDT治疗后,随访3个月,26例泛发性跖疣患者

期刊

尖锐湿疣光动力治疗5-氨基酮戊酸

前向神经网络粒子群优化学习算法研究

将粒子群优化算法用于前向神经网络权值的学习算法研究，以神经网络学习算法研究的典型问题之一的XOR问题作为研究实例，针对算法的收敛性、学习速度以及算法对初值的鲁棒性等性

期刊

前向神经网络粒子群优化BP算法feedforward neural network particle swarm optimization BP al

命令式语言的精确约束时间分析

构造程序语言的部分计值器时最重要的一步是约束时间分析.当已知程序的部分输入时,约束时间分析阶段是区分程序中哪些计算可在部分计值时完成,哪些计算须在运行时完成.然而对

期刊

部分计值约束时间分析递归归约树命令式语言程序变换规则递归调用分析剩余程序partial evaluationbinding time analy

定性映射模型及风险决策应用

针对QM(定性映射)模型提出了一种新的应用推理.给出了QM模型如何学习、如何应用的具体实施算法,并在此基础之上,探讨了辅助风险决策方面的应用.

期刊

定性映射(QM)学习算法风险决策QM (qualitative mappiing)learningarithmeticrisk decision

绞窄性粘连性肠梗阻38例治疗分析

目的总结分析绞窄性粘连性肠梗阻的成因和诊断治疗。方法回顾分析1990～2000年内收治的38例绞窄性粘连性肠梗阻病例。对其发生原因、诊断体征和治疗作了比较分析。结果 38例

期刊

基于强化学习的多Agent系统规划规则抽取方法

与本文相关的学术论文