搜索筛选:
搜索耗时0.5332秒,为你在为你在102,267,441篇论文里面共找到 6 篇相符的论文内容
类      型:
[会议论文] 作者:王冬黎,高阳,陈世福, 来源:中国人工智能学会第10届全国学术年会 年份:2003
本文对当前强化学习的研究现状进行了综述。首先介绍强化学习的原理、结构以及主要算法;其次介绍目前强化学习中的不完全感知、多Agent强化学习及连续状态空间等几个研究热点...
[会议论文] 作者:涂自然,王维,梁以业,禹建丽, 来源:2003年中国智能自动化会议 年份:2003
强化学习一词源于行为科学,它模仿人与动物的自然学习过程,通过对环境的反复试探,从而建立从环境状态到行为动作的映射.本文针对基于神经网络结构的机器人全局路径规划算法,利用强化学习的思想,引进评价预测学习的自适应变步长算法...
[会议论文] 作者:朴松昊,洪炳熔,褚海涛, 来源:2003中国控制与决策学术年会 年份:2003
提出在动态环境中多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,...
[会议论文] 作者:王长缨;姚莉;陈文伟;, 来源:中国人工智能学会第10届全国学术年会 年份:2003
强化学习技术通过将学习过程建模成马氏决策过程,已经解决了单个agent在静态环境下的最优行为策略求解问题。但是...
[会议论文] 作者:古禮權,陳致宏,楊接期, 来源:第七届全球华人计算机教育应用大会 年份:2003
「资讯融入学习」是目前学习上的趋势,我们可利用电脑网路科技不受时间、地点限制的特性,来强化学习的效果。本文介绍了以「目标投定理论」之原理原则,来实地建构一个优质的「儿...
[会议论文] 作者:张敏灵,周志华, 来源:中国人工智能学会第10届全国学术年会 年份:2003
多示例学习被认为足与是监督学习、非监督学习以及强化学习并列的第四类机器学习框架,是当前国际机器学习界的一个研究热点,结合多种学习范式的混合学习是另一研究热点。...
相关搜索: