搜索筛选:
搜索耗时0.1033秒,为你在为你在9,755,000篇论文里面共找到 11 篇相符的论文内容
类      型:
[期刊论文] 作者:连传强, 徐昕, 吴军, 李兆斌,, 来源:智能系统学报 年份:2011
多智能体强化学习算法在用于复杂的分布式系统时存在着状态空间大、学习效率低等问题.针对网络环境中的资源分配问题对多智能体强化学习算法进行了研究,将Q-学习算法和链式反...
[期刊论文] 作者:尚晶,徐长生,, 来源:武汉理工大学学报 年份:2011
提出了基于Q学习算法的集卡调度强化学习模型,对其系统...
[期刊论文] 作者:孙若莹,李忱,赵刚,, 来源:北京信息科技大学学报(自然科学版) 年份:2011
在不确定供应链环境中提高供应链节点决策能力是提高竞争优势的主要方式。需求波动沿供应链从下游到上游逐级放大的牛鞭效应是供应链管理的重要问题。在综合分析供应链牛鞭效...
[学位论文] 作者:王晓燕,, 来源: 年份:2011
遗传算法(Genetic Algorithm, GA)是进化算法中产生最早、影响最大、应用也比较广泛的一个分支算法。它采用达尔文进化论的适者生存、优胜劣汰的进化思想。作为一种全局搜索...
[学位论文] 作者:柴雪霞,, 来源: 年份:2011
Web服务作为部署在互联网上的组件,展现出良好的封装性、松耦合性和跨平台性。然而单个Web服务的能力有限,不能向人们提供功能更全、更复杂的服务。为了减少开发服务的费用和...
[期刊论文] 作者:常晓军,, 来源:计算机工程与应用 年份:2011
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。...
[学位论文] 作者:马力,, 来源: 年份:2011
模糊神经网络是一种新型的人工智能技术,它结合了神经网络和模糊逻辑推理系统两者的优点,相互取长补短,因而使得模糊模式识别和模糊逻辑推理等具有自学习的功能。但是通常的模糊......
[学位论文] 作者:梁英波,, 来源: 年份:2011
本文讨论研究了自适应动态规划ADP (Adaptive dynamic programming)这一基于强化学习和动态规划的通用学习控制系统算法。自适应动态规划ADP是一个非常有前途的研究领域,它是...
[期刊论文] 作者:王冲,景宁,李军,王钧,陈浩,, 来源:国防科技大学学报 年份:2011
在分析任务特点和卫星约束的基础上给出了多星协同任务规划问题的数学模型。引入约束惩罚算子和多星联合惩罚算子对卫星Agent原始的效用值增益函数进行改进,在此基础上提出了...
[学位论文] 作者:王全武,, 来源: 年份:2011
强化学习作为一种无需要环境模型的机器学...
[期刊论文] 作者:高曼,, 来源:实践(思想理论版) 年份:2011
强化学习、终身学习是深刻理解和更好地践行胡...
相关搜索: