RoboCup中基于神经网络的阵型策略在线学习

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:wjjun05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在RoboCup仿真2D系统中,智能体很难在实时动态不确定的环境中做出正确的决策,因此研究学习不可预测的对手阵型策略跑位是迫切需要的。本文在RoboCup仿真2D项目程序设计中提出利用神经网络权值直接确定法在线学习对手阵型策略,并设计学习对手阵型策略的神经网络模型,最后利用在线教练实时训练神经网络的模型。实验结果建立学习对手阵型的神经网络模型,并把训练好的模型加入防守策略中,有效提高了智能体的防守能力,增强了球队的整体技能。
其他文献
延安“抢救运动”发生原因探析秦生1943年上半年,当整风运动进入审干阶段后,在延安发生了“抢救运动”。搞清为什么在全党刚刚进行了一次普遍的马克思列宁主义思想教育运动,确立了一
将重组人三叶因子 3(Trefoilfactor 3,TFF3)作用于人结肠肿瘤细胞 ,研究重组蛋白对细胞增殖的影响 ,结果发现该蛋白在较低的浓度 (10~ 5 0mg L)下对细胞的增殖基本没有影响 ,
<正>一个现代企业需要经营,律师事务所的发展同样也需要经营,笔者试从几个方面来阐述一个律师事务所的经营问题。一、律师事务所性质是一个企业,是一个特殊的企业律师事务所
本文利用我国2005年1月到2012年12月的宏观数据,通过数据的稳定性检验和协整检验,比较分析货币政策信贷传导机制和货币传导机制的有效性,并运用脉冲响应函数和状态空间模型对
以局域规整聚(3-己基噻吩)(P3HT)制备了TiO2/聚合物型双层结构光伏电池.利用稳态电流-电压测试和动态强度调制光电压谱,结合差热分析、吸收光谱和荧光光谱,研究了非晶支化聚
上市公司信息披露质量的测度关系到资本市场稳定、健康发展。通过建立二层结构的信息披露质量测度指标体系,应用熵理论构建了信息披露质量测度模型,提高了信息质量测度结果的客
本研究对舒更葡糖钠的合成方法进行改进。以γ-环糊精为起始物料,经对甲苯磺酰氯酰化得6-全脱氧-6-全对甲苯磺酸酯-γ-环糊精(3)。该法避免了溴素及五氯化磷的使用,克服了合
<正>蛔虫病是儿童常发和多发的肠道寄生虫病,尤其在经济欠发达的农村地区儿童肠道蛔虫病发病率更高。诊断蛔虫病的方法很多,超声检查是近年应用较多的方法,超声具有声像图特
<正> 在去年正式施行的《物权法》第5条中规定:物权的种类和内容,由法律规定。这就是人们熟知的"物权法定"原则。《物权法》还在第三编《用益物权》下设定了一个新的物权类型
本文主要阐述了品牌命名方式即品牌结构战略的概念以及几种主要品牌结构模式 ,专门对公司品牌模式和独立品牌模式这两种最具有代表性的品牌结构模式进行了研究 ,并从消费者、