搜索筛选:
搜索耗时0.1074秒,为你在为你在8,215,000篇论文里面共找到 8 篇相符的论文内容
类      型:
[期刊论文] 作者:连传强, 徐昕, 吴军, 李兆斌,, 来源:智能系统学报 年份:2011
多智能体强化学习算法在用于复杂的分布式系统时存在着状态空间大、学习效率低等问题.针对网络环境中的资源分配问题对多智能体强化学习算法进行了研究,将Q-学习算法和链式反...
[期刊论文] 作者:尚晶,徐长生,, 来源:武汉理工大学学报 年份:2011
提出了基于Q学习算法的集卡调度强化学习模型,对其系统...
[期刊论文] 作者:孙若莹,李忱,赵刚,, 来源:北京信息科技大学学报(自然科学版) 年份:2011
在不确定供应链环境中提高供应链节点决策能力是提高竞争优势的主要方式。需求波动沿供应链从下游到上游逐级放大的牛鞭效应是供应链管理的重要问题。在综合分析供应链牛鞭效...
[期刊论文] 作者:常晓军,, 来源:计算机工程与应用 年份:2011
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。...
[学位论文] 作者:马力,, 来源: 年份:2011
模糊神经网络是一种新型的人工智能技术,它结合了神经网络和模糊逻辑推理系统两者的优点,相互取长补短,因而使得模糊模式识别和模糊逻辑推理等具有自学习的功能。但是通常的模糊......
[学位论文] 作者:梁英波,, 来源: 年份:2011
本文讨论研究了自适应动态规划ADP (Adaptive dynamic programming)这一基于强化学习和动态规划的通用学习控制系统算法。自适应动态规划ADP是一个非常有前途的研究领域,它是...
[学位论文] 作者:王全武,, 来源: 年份:2011
强化学习作为一种无需要环境模型的机器学...
[期刊论文] 作者:高曼,, 来源:实践(思想理论版) 年份:2011
强化学习、终身学习是深刻理解和更好地践行胡...
相关搜索: