切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
强化学习在机器人足球比赛中的应用
强化学习在机器人足球比赛中的应用
来源 :计算机应用研究 | 被引量 : 63次 | 上传用户:xqm009
【摘 要】
:
机器人足球比赛是一个有趣并且复杂的新兴的人工智能研究领域 ,它是一个典型的多智能体系统。采用强化学习方法研究了机器人足球比赛中的足球机器人的动作选择问题 ,扩展了单个Agent的强化学习方法 ,提出了基于多Agents的强化学习方法 ,最后给出了实验结果。
【作 者】
:
孟伟
洪炳熔
韩学东
【机 构】
:
哈尔滨工业大学
【出 处】
:
计算机应用研究
【发表日期】
:
2002年06期
【关键词】
:
强化学习
机器人足球比赛
多智能体
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人足球比赛是一个有趣并且复杂的新兴的人工智能研究领域 ,它是一个典型的多智能体系统。采用强化学习方法研究了机器人足球比赛中的足球机器人的动作选择问题 ,扩展了单个Agent的强化学习方法 ,提出了基于多Agents的强化学习方法 ,最后给出了实验结果。
其他文献
为农村金融开渠引道——金湖承包地确权登记颁证成果应用探索
为使更多“沉睡”的土地资源真正活起来,江苏金湖县自2013年试点土地确权登记颁证以来,启动了农村宅基地和土地承包经营权有偿退出、互换并地、抵押贷款等15项改革试点。2016
期刊
农村金融
成果应用
金湖县
承包地
农村土地承包经营权
农村土地经营权
农村土地承包纠纷
改革试点
基于移动Agent的Internet拓扑自动发现研究
发现网络拓扑是实现许多关键网络管理任务的先决条件。然而由于Internet具有庞大的规模和动态性 ,因而发现Internet的拓扑是一项非常困难的任务。提出了一个基于移动Agent的分布式Internet拓扑发现算法 ,在算法中各个自治系统内的拓扑发现采用分布式的方式 ,因而比传统的基于客户 /服务器模式和SNMP的方法具有更高的效率和更好的可伸缩性。
期刊
移动AGENT
INTERNET
拓扑
自动发现
网络管理
路由器
Topology
Mobile Agent
SNMP(Simple Network Mana
“十二五”时期农村集体产权制度改革情况统计分析
十二五”期间,按照中央全面深化农村改革的总体部署,各地结合实际,探索开展农村集体产权制度改革,取得积极进展。主要有以下特点:一、完成改革的村有较大幅度增长“十二五”期间,全
期刊
产权制度改革
“十二五”
农村集体
统计分析
农村改革
东部地区
中部地区
西部地区
基于XML的企业信息交换
由于XML固有的优点 ,现在已逐渐成为Internet上数据表示与交换的标准。从企业对外界信息的及时需求的角度出发 ,分析了传统的EDI技术的不足之处 ,讨论了XML在企业信息交换中的应用 ,给出了目前应用XML进行企业信息交换的两种方案 ,并提出一种基于XML的企业信息交换的实现方式。
期刊
XML
EDI
数据交换
XML
EDI
Data exchange
数据仓库中异构数据的转换
在大多数信息管理中都存在模式和数据转换 ,且都是单独被研究。相信有统一的机制 ,将中间件看成是转换引擎 ,并且讨论在什么时候进行转换和如何进行转换。
期刊
数据转换
数据库
数据源
异构数据
数据仓库
Data Warehouse
Data Transition
动态多版本并行控制技术在主存数据库中的实现
针对主存数据库中以索引为基础的数据访问并行控制 问题提出了动态多版本技术,并考虑了记录数据和索引结点各自的多版本管理方案及相互联 系。实验证明该技术允许对数据库更新操作的并行执行,减少了对数据锁定的需求以及版本 维护所需的系统开销,同时保证了只读事务的无阻塞性,提高了系统的整体性能。该技术尤 其适用于以只读事务为主的应用。
期刊
动态多版本
并行控制
主存数据库
Main Memory Database System;Trans action;Concurrency Control;Dy
其他学术论文