多智能体协作学习方法的研究

来源 :长沙理工大学 | 被引量 : 7次 | 上传用户:shylockbc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多Agent系统中,由于环境是动态变化的,其他Agent的行为是未知的,所以多Agent系统及系统中的每个Agent应当具备学习或自适应能力。强化学习作为一种不需要环境模型的机器学习方法,现已成为多Agent系统的研究热点。与此同时,由于单个Agent的资源和能力的有限性,需要多个Agent之间的协作来共同完成任务。本文的主要研究工作包括以下几个方面:(1)论文首先介绍了Agent和多Agent系统的研究基础,然后分别围绕多Agent学习方法、多Agent协作机制和强化学习三个方面简要阐述了多Agent协作学习的基础知识。(2)将黑板模型、融合算法以及强化学习技术相结合,提出了一种改进的多智能体协作学习方法。其中,黑板是一块共享的存储区域,可以实现信息共享;融合算法用来对共享信息进行融合;强化学习技术利用融合结果进行动作选择。(3)追捕问题是一个多Agent系统,同时存在多Agent之间的协作与竞争,被广泛用来测试人工智能领域的学习算法。本文利用追捕问题对改进的多智能体协作学习方法进行实例分析与仿真验证。实验结果表明,该方法能够有效地提高多Agent系统中Agent的协作学习能力。
其他文献
迁移工作流技术是近年来基于移动agent技术提出的一种新的工作流研究方向,特别适合需要频繁地传递大量数据,以及需要大量调用远程服务的分布式并发处理过程。文献提出了一个
形式化方法(Formal Method)基于严格的数学理论,能产生精确、无二义性的形式规约,为软件开发提供了严格的数学基础,对提高软件的可靠性有着非常显著的作用。形式化方法要求开
语义网(Semantic Web)是对现有Web的扩展,其目标是使Web上的信息具有计算机可以理解的语义。而本体(Ontology)则描述了其中的语义,本体在语义网中起到了重要的作用。由于语义
人类认知存在的局限性、信息描述的差异、度量的误差以及数据的动态变化等等,往往会产生许多不确定的数据。而随着不确定性研究的深入,未来世界的不确定性特征逐渐得到现代学
随着电子政务建设的深入,政务门户网站建设的增多,其所承载的信息资源数量越来越大,门户网站也摆脱不了信息孤岛的宿命,传统的政府门户网站的建设模式也面临着一定的危机和挑战。
即时通信实时、多样化的服务特点使它逐渐替代电子邮件的地位,成为互联网用户日常交流的一种重要手段。在开放的互联网上传递消息,安全性是一个不可回避的问题,对用户之间发
决策支持系统(Decision Support System,DSS)是企业经营决策和提高企业核心竞争力的重要工具,它通过为企业提供各种决策信息及解决方案来提高决策的质量和效率。Agent技术是
肝脏分割是肿瘤切除手术、活体肝移植和微创手术等计算机辅助手术的基础。但是在肝脏和胃、心脏、肋骨的肋下脂肪等相邻组织的边界,相邻的器官通常和肝脏自身的密度非常相似。
医学图像配准是现代医学图像处理技术的一个重要方面,为医生充分利用多种模态的医学图像信息,提高医学诊断和治疗的准确性打下了基础。它不仅可以用于诊断治疗,还可以用于病
随着网络技术和Internet的迅速发展,基于B/S结构的服务端应用程序得到了广泛的应用。而J2EE平台的成熟以及各种开源框架的发展,为Web应用程序更进一步的发展提供了更广阔的空间