论文部分内容阅读
提出一种基于案例推理的多agent强化学习方法.构建了系统策略案例库,通过判断agent之间的协作关系选择相应案例库子集.利用模拟退火方法从中寻找最合适的可再用案例策略,agent按照案例指导执行动作选择.在没有可用案例的情况下,agent执行联合行为学习(JAL).在学习结果的基础上实时更新系统策略案例库.追捕问题的仿真结果表明所提方法明显提高了学习速度与收敛性.