搜索与强化学习相关的论文

搜索筛选:

搜索耗时0.1074秒,为你在为你在8,215,000篇论文里面共找到 8 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

面向资源分配问题的Q-CF多智能体强化学习

[期刊论文] 作者：连传强, 徐昕, 吴军, 李兆斌,, 来源：智能系统学报年份：2011

多智能体强化学习算法在用于复杂的分布式系统时存在着状态空间大、学习效率低等问题.针对网络环境中的资源分配问题对多智能体强化学习算法进行了研究,将Q-学习算法和链式反...

下载此文

基于强化学习的集装箱码头卡车调度策略研究

[期刊论文] 作者：尚晶,徐长生,, 来源：武汉理工大学学报年份：2011

提出了基于Q学习算法的集卡调度强化学习模型,对其系统...

下载此文

基于强化学习的牛鞭效应对策模型

[期刊论文] 作者：孙若莹,李忱,赵刚,, 来源：北京信息科技大学学报(自然科学版) 年份：2011

在不确定供应链环境中提高供应链节点决策能力是提高竞争优势的主要方式。需求波动沿供应链从下游到上游逐级放大的牛鞭效应是供应链管理的重要问题。在综合分析供应链牛鞭效...

下载此文

基于联合强化学习的RoboCup-2D传球策略

[期刊论文] 作者：常晓军,, 来源：计算机工程与应用年份：2011

在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。...

下载此文

基于强化学习改进的模糊神经网络及其应用研究

[学位论文] 作者：马力,, 来源：年份：2011

模糊神经网络是一种新型的人工智能技术，它结合了神经网络和模糊逻辑推理系统两者的优点，相互取长补短，因而使得模糊模式识别和模糊逻辑推理等具有自学习的功能。但是通常的模糊......

下载此文

基于ADP的在线学习算法及其在热轧活套中的应用研究

[学位论文] 作者：梁英波,, 来源：年份：2011

本文讨论研究了自适应动态规划ADP (Adaptive dynamic programming)这一基于强化学习和动态规划的通用学习控制系统算法。自适应动态规划ADP是一个非常有前途的研究领域,它是...

下载此文

基于多智能体间协作模型及其学习方法研究

[学位论文] 作者：王全武,, 来源：年份：2011

强化学习作为一种无需要环境模型的机器学...

下载此文

终身学习提高党性修养

[期刊论文] 作者：高曼,, 来源：实践(思想理论版) 年份：2011

强化学习、终身学习是深刻理解和更好地践行胡...

下载此文