搜索与强化学习相关的论文

搜索筛选:

搜索耗时0.4775秒,为你在为你在102,267,441篇论文里面共找到 8 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

分层式强化学习研究进展

[会议论文] 作者：陈春林;, 来源：'2008系统仿真技术及应用学术会议年份：2008

强化学习是机器学习的一个重要分支，在智能控制中有着广泛应用，具有分层结构的学习算法是克服复杂问题维数灾难、提高学习速度和适应性的关键技术之一。本文综述了分层式强化学...

下载此文

基于强化学习算法的电梯群控系统仿真研究

[会议论文] 作者：李大字,褚建华,靳其兵, 来源：第19届中国过程控制会议年份：2008

电梯群控系统的任务是有效地运送乘客,提高电梯运行效率、改善服务质量.采用最合适的调度算法分派电梯是提高电梯群控性能的关键.本文是将强化学习算法与人工神经网络结合提出一种改进的电梯群控算法,并通过Visual...C++语言设计仿真系统.就三种不同的交通流模式进行了比较,测试结果表明基于神经网络的强化学习的电梯群控算法,能够有效地减少乘客的平均等待时间....

下载此文

针对机器人觅食任务的强化学习算法及其仿真研究

[会议论文] 作者：陈宗海,段家庆,任燚,罗杨宇,李成荣, 来源：2008系统仿真技术及应用学术会议年份：2008

针对传统强化学习算法在执行学习任务时只在完成一系列动作后获得奖赏，不能对每个动作进行奖赏分配，无法满足复杂实时任务的要求。...本文提出了过程奖赏Course Reward-CR，关心的是完成任务过程中的每个动作和趋势，实时对其进行奖赏．并提出了一种基于过程奖赏和优先扫除PrioritizedSweeping-PS的强化学习算法...

下载此文

针对机器人觅食任务的强化学习算法及其仿真研究

[会议论文] 作者：陈宗海[1]段家庆[1]任燚[1]罗杨宇[2]李成荣[2], 来源：'2008系统仿真技术及应用学术会议年份：2008

针对传统强化学习算法在执行学习任务时只在完成一系列动作后获得奖赏，不能对每个动作进行奖赏分配，无法满足复杂实时任务的要求。本文提出了过程奖赏Course Reward-CR，关心的是...

下载此文

基于Q-学习的进化博弈决策模型

[会议论文] 作者：刘伟兵,王先甲, 来源：中国系统工程学会第十五届年会年份：2008

基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究...

下载此文

一种适合MMOG的强化学习方法

[会议论文] 作者：王洪彦;, 来源：第五届中国软件工程大会年份：2008

提出了一种适合MMOG的强化学习算法，算法中NPC(Non PlayerCharacter)选择的策略是基于对其他NPC选择的策略的信任基础上，不同于现有的大部分算法是基于对行动的信任上。该...

下载此文

基于变结构神经网络的移动机器人导航算法研究

[会议论文] 作者：乔俊飞;樊瑞元;, 来源：第19届中国过程控制会议年份：2008

针对未知环境下移动机器人导航问题,本文提出一种基于可变结构自组织特征映射(SOFM)网络和强化学习的机器人导航算法.SOFM网络根据环境的复杂度,通过增加和删除网络节点以及...

下载此文

一种改进的IEEE 802.15.4自适应实时带宽分配策略

[会议论文] 作者：毛剑琳;向凤红;冯丽辉;, 来源：第27届中国控制会议年份：2008

为了加强协议对随机性环境的适应性，在强化学习的优化框架下，提出以数据查询...

下载此文

看过本文同时还关注