搜索筛选:
搜索耗时0.4775秒,为你在为你在102,267,441篇论文里面共找到 8 篇相符的论文内容
类      型:
[会议论文] 作者:陈春林;, 来源:'2008系统仿真技术及应用学术会议 年份:2008
强化学习是机器学习的一个重要分支,在智能控制中有着广泛应用,具有分层结构的学习算法是克服复杂问题维数灾难、提高学习速度和适应性的关键技术之一。本文综述了分层式强化学...
[会议论文] 作者:李大字,褚建华,靳其兵, 来源:第19届中国过程控制会议 年份:2008
电梯群控系统的任务是有效地运送乘客,提高电梯运行效率、改善服务质量.采用最合适的调度算法分派电梯是提高电梯群控性能的关键.本文是将强化学习算法与人工神经网络结合提出一种改进的电梯群控算法,并通过Visual...C++语言设计仿真系统.就三种不同的交通流模式进行了比较,测试结果表明基于神经网络的强化学习的电梯群控算法,能够有效地减少乘客的平均等待时间....
[会议论文] 作者:陈宗海,段家庆,任燚,罗杨宇,李成荣, 来源:2008系统仿真技术及应用学术会议 年份:2008
针对传统强化学习算法在执行学习任务时只在完成一系列动作后获得奖赏,不能对每个动作进行奖赏分配,无法满足复杂实时任务的要求。...本文提出了过程奖赏Course Reward-CR,关心的是完成任务过程中的每个动作和趋势,实时对其进行奖赏.并提出了一种基于过程奖赏和优先扫除PrioritizedSweeping-PS的强化学习算法...
[会议论文] 作者:陈宗海[1]段家庆[1]任燚[1]罗杨宇[2]李成荣[2], 来源:'2008系统仿真技术及应用学术会议 年份:2008
针对传统强化学习算法在执行学习任务时只在完成一系列动作后获得奖赏,不能对每个动作进行奖赏分配,无法满足复杂实时任务的要求。本文提出了过程奖赏Course Reward-CR,关心的是...
[会议论文] 作者:刘伟兵,王先甲, 来源:中国系统工程学会第十五届年会 年份:2008
基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究...
[会议论文] 作者:王洪彦;, 来源:第五届中国软件工程大会 年份:2008
提出了一种适合MMOG的强化学习算法,算法中NPC(Non PlayerCharacter)选择的策略是基于对其他NPC选择的策略的信任基础上,不同于现有的大部分算法是基于对行动的信任上。 该...
[会议论文] 作者:乔俊飞;樊瑞元;, 来源:第19届中国过程控制会议 年份:2008
针对未知环境下移动机器人导航问题,本文提出一种基于可变结构自组织特征映射(SOFM)网络和强化学习的机器人导航算法.SOFM网络根据环境的复杂度,通过增加和删除网络节点以及...
[会议论文] 作者:毛剑琳;向凤红;冯丽辉;, 来源:第27届中国控制会议 年份:2008
为了加强协议对随机性环境的适应性,在强化学习的优化框架下,提出以数据查询...
相关搜索: