基于机器学习的3D仿真足球机器人动作与协作优化

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhuyudream
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在RoboCup3D仿真平台中,实现建立了高通量计算机集群HTCondor系统,并在此基础上建立了Robocup3D个体机器人的动作优化机制,对机器人的踢球及行走参数进行了训练优化,其次基于足球队伍的阵型及角色分配两个问题研究了动态环境中多智能体的有效协作对抗策略。个体机器人的动作优化问题中,由于单机优化速度较慢,采用高吞吐量计算机集群系统分配网络资源,缩短优化时间;其次利用CMA-ES算法,对5类机器人的踢球动作进行了优化,使用该算法的增强学习训练框架,成功地优化了机器人的远射及快踢动作。针对机器人行走优化对单一训练任务过拟合的问题,设计了多个子任务和多个子参数集的分层学习方法,全面提升了5类机器人的行走、转弯和带球的机动性和稳定性。多智能体的协作对抗策略中,分别针对足球队伍的阵型优化和多智能体的角色分配优化问题进行了研究。首先基于Delaunay三角网对足球场进行了剖分,并采用基于形势的阵型机制(SBSP)对足球队伍的阵型进行了设计,有效实现了足球在关键位置的足球队伍整体阵型的多样化;在阵型确定的基础上,利用Markov决策过程(MDP)模型,对机器人队伍的角色分配进行了优化,综合考虑仿真环境中5种不同类型的机器人的距离、朝向、是否跌倒、速度等影响因素,利用线性函数近似的Sarsa(?)学习算法对MDP模型中的动作值函数进行求解,寻找最优的角色分配方案,提高了团队的整体进攻防守效率。经过多次实验证明,本文的研究对于Apollo3D队伍的个体机器人以及整体队伍的阵型分配及角色轮换方面有着较大的提升。
其他文献
伴随着国内旅游业的迅猛发展,人们对旅游的需求愈加强烈,同时对旅游品质的要求越来越高,以水为主的湖泊旅游已经成为旅游业的一大热点。旅游业已经成为了带动地区经济发展的一个
<正>锰合金是由锰、硅、铁及少量碳和其它元素组成的合金,主要产品有硅锰和锰铁。锰具有脱氧、脱硫及调节作用(如阻止钢的粒缘碳化物的形成),还能增加钢材的强度、韧性、可淬
这看似不起眼的泥巴,却有着它不可比拟的强大塑造性,当我们选择了"泥"作为孩子创造性发展的素材时,我们在起步之处就成功了一大半。那么如何让这样的素材发挥它最极致的教育
压载系统作为半潜式钻井平台上的重要系统,起到调节平台吃水及平衡的作用,关系到平台的安全和工作人员的生命财产安全。文章以半潜式钻井平台的压载系统为例,阐述了重力压载
某海上无人值守平台,产量低,属于边际油田。在不影响生产需求、质量和安全的前提下,对其开展优化设计提高收益水平。本文阐述的开闭排系统联控设计,意在增加系统的可靠性、减
目的:对于老年高血压伴血脂异常患者,采用苯磺酸氨氯地平与阿托伐他汀钙联合治疗,分析其临床疗效.方法:随机选取2017年5月-2019年5月期间在我院进行治疗的老年高血压伴血脂异
素质教育是教育的行为选择。高等教育承担着为国家输送高级人才的任务 ,通过素质教育确保人才质量是必要前提。本文是辽宁省教育科研重点项目《高等院校实施素质教育》的研究
国家性科研院所是日本船舶工业获得和保持技术竞争优势的重要依靠力量,如何对国家性科研院所进行管理对于提升其运行效率,增强基础性、共性技术的研究能力具有十分重要的意义.
随着企业社会责任活动的深入开展,企业界和学术界羽其做了广泛的探讨,但就如何实施企业社会责任还没有多少可以借鉴的成果,本文通过营销学视角,借鉴产品经营法则,给出企业履行企业