切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
多智能体的增强学习及其在RoboCup中的应用
多智能体的增强学习及其在RoboCup中的应用
来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:dawneagle
【摘 要】
:
针对非确定马尔可夫环境下的多智能体系统,提出了多智能体Q学习模型和算法。算法中通过对联合动作的统计来学习其它智能体的行为策略,并利用智能体策略向量的全概率分布保证了
【作 者】
:
刘国栋
杨宝庆
【机 构】
:
江南大学控制科学与工程研究中心
【出 处】
:
计算机工程与应用
【发表日期】
:
2008年23期
【关键词】
:
多智能体
增强学习
机器人世界杯足球锦标赛
Multi-Agents Systems (MAS)
reinforcement learning
Robot
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对非确定马尔可夫环境下的多智能体系统,提出了多智能体Q学习模型和算法。算法中通过对联合动作的统计来学习其它智能体的行为策略,并利用智能体策略向量的全概率分布保证了对联合最优动作的选择。在实验中,成功实现了智能体的决策,提高了AFU队的整体的对抗能力,证明了算法的有效性和可行性。
其他文献
中学英语阅读教学策略探究
本文根据高中英语教学大纲(试验修订版)对阅读教学的要求和原则,针对当前中学英语阅读教学中存在的问题,提出了中学英语阅读教学的策略和方法,认为阅读教学要实现从重视知识
期刊
阅读教学
策略
方法
基于三维栅格的GIS距离分析算法研究与应用
基于距离的分析是GIS中的一项基本空间分析功能,目前该分析主要是基于二维的,对三维空间的距离分析研究则较少。对基于三维栅格的距离分析进行了研究,提出了基于三维栅格的最短距离算法,并把该算法应用于非均质的三维缓冲体的生成。
期刊
三维GIS
栅格
最短距离
缓冲体
the three dimension GIS
raster
the shortest distance
buffer
连续-钢桁组合结构钢桁下节点安装定位施工工艺
以西宁跨兰西高速公路特大桥(80+168+80)m连续-钢桁组合结构钢桁下节点安装定位工程施工为例,详细介绍了下节点在连续梁砼施工过程中如何精确定位和安装,确保在连续梁施工完成后
期刊
连续-钢桁组合结构
下节点
定位
安装
continuous steel composite structer
lower node
location
i
利用GA决策理论模型增强信息系统的生存性
生存控制器被广泛地应用在关键的信息系统中。生存控制器的一个重要功能是做决策,也就是基于收益评价从用户给出的行动集合中选择相应的行动序列。因此,决策的质量决定了控制器
期刊
生存控制器
行动序列
背包问题
旅行商问题
遗传算法
survivability controller
Action Sequence ( AS )
Kn
面向车间作业计划与执行同步的动态调度技术
车间作业计划安排与实际执行的同步是制造执行系统需要解决的核心技术问题。通过系统的分析动态调度的问题类型,形成了动态调度的机制和策略;根据车间执行实时反馈信息,提出了基
期刊
制造执行系统
作业计划与执行同步
故障调度
人机交互调度
动态工作日制
Manufacturing Execution System(MES)
synchron
一种新的基于重排序的相关反馈图像检索方法
提出了一种新的相关反馈方法,该方法引入了Rnorm重排序机制。通过计算用户反馈的按个人兴趣排列的期望输出顺序与系统输出图像顺序之间的.Rnorm值,来调整各个特征的权重,从而指导
期刊
颜色
纹理
形状
特征融合
重排序机制
相关反馈
color
texture
shape
feature fusion
re-ranking mech
做好课程教学工作的实践与思考
提升教师素质, 提高教学质量,是摆在大学教育管理者和广大教师面前的一个恒久的课题.以物理化学课程教学为例, 从科研与实践、 教研、 爱与兴趣三个方面提出做好教学工作, 提
期刊
科研与实践
教研
爱与兴趣
物理化学
教学
scientific research and practice
teaching research
love an
基于分组误差的快速分数像素运动估计算法
H.264是最新一代的视频编码标准,它支持高精度分数像素运动估计。当在整数运动估计中采用快速算法后,分数像素的运动估计可能成为制约快速运动估计算法性能的瓶颈。根据匹配准则
期刊
视频编码
H.264
运动估计
分数像素
分组误差
video coding
H.264
motion estimation
subpel
gro
伪MTL代数的性质及其滤子
介绍了伪MTL代数的一些重要性质,引入了伪MTL代数的滤子、素滤子以及极大滤子的概念,研究了它们的性质以及它们之间的关系。
期刊
伪MTL代数
滤子
素滤子
pseudo MTL algebras
filter
prime filter
其他学术论文