Multi-agent在机器人足球赛中的应用

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:element_li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,有关Multi-agent系统(MAS)与分布式人工智能(DAI)的研究,已经成为人工智能领域的重要研究方向之一。该研究方向要求在一个实时动态变化的和不可预测的环境中,拥有自主能力的Agent,作为团队的一部分,能自动地进行有效的动作,完成整个队伍的目标。 RoboCup即机器人世界杯足球赛,是一个典型的Multi-agent系统,它具有MAS的所有特性。同时,机器人足球具有观赏性和刺激性,可以很好的展示Multi-agent系统的研究成果。鉴于机器人足球的这些特点,国际人工智能界选择了机器人足球作为Multi-agent系统研究的一个标准问题,在本文中,我们使用仿真机器人足球作为我们研究的载体。 本文首先对Agent及Multi-agent及RoboCup进行了简单介绍,然后较为详细地介绍了仿真机器人足球赛的2D仿真环境。最后介绍了仿真机器人足球的一些主要模型并描述了Oryx的实现过程与方法。 本文设计了一个分层的Agent结构Oryx。整个系统按照模块化设计,采用面向对象的方法,用C++语言在Linux平台上进行了实现。整个系统一共分为三层:通讯层、动作层和高层决策层,低层为上一层服务,高层则调用下一层的方法。层次结构的设计,使得整个程序的结构更加清晰。整个Agent采用符合POSIX规范的多线程技术,线程问通过互斥技术进行通讯。 本文通过机器学习算法实现Agent的个体智能,比如射门、截球、传球等。本文首先重点研究了BP神经网络学习算法,使用这种学习算法实现截球和传球等个体动作模型,最后结合足球领域专家的知识实现了Agent间的协作。在设计中使用了Robocup中一个典型的协作方法SBSP作为Oryx的高层决策机制,取得了较好的效果。该Agent充分考虑了系统的实时性和噪音,具有合理的结构和相当的智能性并且能够根据环境做出比较协调的协作动作,能够在高层决策的统一框架内协调、协作,一起实现共同的目标:取得比赛的最终胜利。 要进行仿真组的Agent设计,必须考虑到各种技术,包括自主智能体设计原则,多智能体合作,策略获取,实时推理。目前的主要难点在于在线学习、对抗环境下的实时战略研究和Multi-agent间的合作、协作方法的研究。包括动态协调机制、协商策略和高级攻防战略的应用研究等。
其他文献
WCDMA移动数据库(HLR、VLR和SGSN)保存着用户的所有签约信息、位置信息,其网络位置十分重要。一旦移动数据库中的任何一个发生故障,轻则受影响的用户在故障期间无法进行业务
远程教育是构建终生教育和全民教育体系的重要组成部分。区别于传统课堂里被动地接受知识,这种新教学环境下的学生在学习过程中有了更多的交互,有了更大主动性。因此,全面实
社会保险是一种受国家政策、法律保护的强制性保险,涉及所有的企事业单位职工,它关系到每一个职工的福利,诸如养老金发放、住院治病等,是老百姓关心的焦点和热点问题,直接影
当前社会的信息化趋势和计算机、通信技术的发展,推动着传统的DSS向群体决策支持系统GBSS发展,并使GDSS成为信息领域的一个前沿课题。 论文从理论研究入手,分析了群体决策
在原始影像立体像对的基础上,实现数字高程模型(DEM)的全自动提取是数字摄影测量中的最重要的技术之一.而DEM全自动提取的关键技术就是立体像对的全自动影像匹配.本文在对当
近几年,信贷风险已渗透到银行的每一信贷经营之中,严重影响到银行的生存和发展。出于控制信贷风险等业务上的紧迫需求,建设银行开发出了信贷管理信息系统用于建行的信贷管理。
  关联规则分析是商业行为分析的一个重要手段,多数关联分析是基于置信度的框架,也有研究人员将兴趣度作为另一个重要标准,然而这些方法给出的模式信息多半互相冲突,行业通用性
  本文研究的是车辆路径优化问题(VRP)的两个分支——多埠车辆路径优化问题(MDVRP)和分离递送车辆路径优化问题(SDVRP),并阐述了两种解决策略:传统的双层搜索方法和新的单层
实时多媒体通信是多媒体计算机技术与现代网络通信技术相结合的产物,它作为通信技术的一个重要组成部分,正随着现代网络通信技术飞速发展起来。通过多媒体技术和网络通信技术
近些年来随着社交网络的快速发展以及普及,人们将越来越多的时间放到了社交网络上,这使得社交网络成为最有潜力的广告以及商业平台。品牌跟踪是近些年出现的一种服务,通过分析品