搜索筛选:
搜索耗时0.2103秒,为你在为你在92,230,000篇论文里面共找到 1,000 篇相符的论文内容
类      型:
[期刊论文] 作者:吴元斌,, 来源:电脑与信息技术 年份:2009
强化学习是agent学习的重要部分,agent强化学习包括单agent强化学习和多agent强化学习。文章对单agent强化学习与多...
[会议论文] 作者:王冬黎,高阳,陈世福, 来源:中国人工智能学会第10届全国学术年会 年份:2003
本文对当前强化学习的研究现状进行了综述。首先介绍强化学习的原理、结构以及主要算法;其次介绍目前强化学习中的不完全感知、多Agent强化学习及连续状态空间等几个研究热点...
[期刊论文] 作者:马骋乾,谢伟,孙伟杰, 来源:指挥控制与仿真 年份:2018
强化学习是机器学习领域内的研究热点,主要用来实现决策优化。首先介绍了强化学习的基本原理和经典算法,包括基于值函数的强化学习算法和基于直接策略搜索的强化学习算法;然后针...
[会议论文] 作者:高阳, 来源:第四届中国Agent理论与应用学术会议 年份:2012
根据多Agent系统中Agent目标的不同,多Agent强化学习被分为合作多Agent强化学习、基于平衡解的多Agent强化学习、基于最佳响应...
[期刊论文] 作者:徐松林,, 来源:电脑知识与技术 年份:2019
并且随着强化学习的兴起,将深度学习与强化学习算法结合起来,形成深度强化学习算法,并得到了广泛的研究,将其应...
[期刊论文] 作者:刘旖菲, 来源:电脑知识与技术:学术版 年份:2021
深度强化学习在可以手动设计奖励函数的领域取得了优异的效果。逆向强化学习利用专家演示数据推断奖励函数,可以有效解决强化学习的奖励函数设计困难的问题。为了全面反映逆...
[期刊论文] 作者:李瑞, 来源:渝西学院学报:自然科学版 年份:2004
介绍了强化学习模型,分别提出了7个主要的强化学习算法并讨论了它们之间的区别和联系,最后指出了强化学习算法中有待解决的问题....
[期刊论文] 作者:赵星宇, 丁世飞,, 来源:计算机科学 年份:2018
作为一种崭新的机器学习方法,深度强化学习将深度学习和强化学习技术结合起来,使智能体能够从高维空间感知信息,并根据得到的信息训练模型、做出决策。由于深度强化学习算法...
[期刊论文] 作者:沈晶,顾国昌,刘海波,, 来源:模式识别与人工智能 年份:2005
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支。但是,强化学习一直被"维数灾"问题所困扰。近年来,分层强化学习...
[期刊论文] 作者:, 来源:模式识别与人工智能 年份:2005
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.但是,强化学习一直被“维数灾”问题所困扰.近年来,分层强化学习...
[期刊论文] 作者:柯文德,陈珂,余凤燕,, 来源:广东石油化工学院学报 年份:2013
首先介绍了强化学习基本原理,分析了马尔科夫决策过程与半马尔科夫决策过程的理论基础及其在强化学习中的应用,其次阐述了分层强化学习中分层与抽象的思想,分析了HAM、Options与...
[期刊论文] 作者:陈希亮, 曹雷, 何明, 李晨溪, 徐志雄,, 来源:计算机工程与应用 年份:2018
深度逆向强化学习是机器学习领域的一个新的研究热点,它针对深度强化学习的回报函数难以获取问题,提出了通过专家示例轨迹重构回报函数的方法。首先介绍了3类深度强化学习方...
[期刊论文] 作者:陈宗海,杨志华,王海波,盛捷,, 来源:控制与决策 年份:2008
为推进强化学习研究的进一步深入和扩大其实际应用范围,从强化学习研究的理论基础——知识表示和运用的角度对强化学习进行分类,并就经典随机强化学习、模糊强化学习、定性强...
[学位论文] 作者:杜威,, 来源:中国矿业大学 年份:2004
强化学习通常被认为是决策任务的一般形式,与动态规划和博弈论密切相关。多智能体强化学习是多智能体系统研究领域的重要分支,其将强化学习技术和博弈论应用于多智能体系统,...
[期刊论文] 作者:柯文德,陈珂,余凤燕,, 来源:广东石油化工学院学报 年份:2013
首先介绍了强化学习基本原理,分析了马尔科夫决策过程与半马尔科夫决策过程的理论基础及其在强化学习中的应用,其次阐述了分层强化学习中分层与抽象的思想,分析了HAM、Options与...
[期刊论文] 作者:周文吉,俞扬,, 来源:智能系统学报 年份:2017
强化学习(reinforcement learning)是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解决的主要问题是,智能体如何直接与环境进行交...
[学位论文] 作者:杨旭东, 来源:苏州大学 年份:2012
强化学习(reinforcement learning, RL)是一类重要的机器学习方法,在智能机器人、经济学、工业制造和博弈等领域得到了广泛的应用。然而目前的强化学习算法在可扩展性方面都...
[学位论文] 作者:葛屾, 来源:南京大学 年份:2008
强化学习是与传统的监督学习完全不同的学习框架。在强化学习中,agent感知环境的状态并采取相应的动作,同时得到环境的奖赏反馈。agent无需假设任何有关环境的先验知识,而是通过...
[期刊论文] 作者:刘忠,李海红,刘全,, 来源:计算机工程与设计 年份:2008
针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在某状态下选择动作的策略以及无导师在线学习等特性。在介绍强化学习的原理、分类以及主要算...
[期刊论文] 作者:喻建鹏, 桂建平,, 来源:电脑知识与技术 年份:2008
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支,该文首先介绍了强化学习的基本原理结构和各种算法;然后介绍了近...
相关搜索: