搜索与强化学习相关的论文

深度强化学习概述

[期刊论文] 作者：徐松林,, 来源：电脑知识与技术年份：2019

并且随着强化学习的兴起,将深度学习与强化学习算法结合起来,形成深度强化学习算法,并得到了广泛的研究,将其应...

下载此文

深度逆向强化学习研究综述

[期刊论文] 作者：陈希亮, 曹雷, 何明, 李晨溪, 徐志雄,, 来源：计算机工程与应用年份：2018

深度逆向强化学习是机器学习领域的一个新的研究热点,它针对深度强化学习的回报函数难以获取问题,提出了通过专家示例轨迹重构回报函数的方法。首先介绍了3类深度强化学习方...

下载此文

强化学习研究综述

[期刊论文] 作者：高阳,陈世福,陆鑫, 来源：自动化学报年份：2004

强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别...

下载此文

基于高斯过程的强化学习算法的研究及实现

[学位论文] 作者：王芳黎,, 来源：武汉理工大学年份：2016

强化学习(Reinforcement Learning)是一种重要的机器学习方法,在人工智能领域有着举足轻重的地位。强化学习算法又分为有模型的强化学习与无模型的强化学习,其中传统的基于模...

下载此文

基于平均报酬模型的强化学习算法研究

[期刊论文] 作者：黄炳强,曹广益,费燕琼,王占全,, 来源：上海理工大学学报年份：2006

对于有吸收目标状态的循环任务，比较合理的方法是采用基于平均报酬模型的强化学习．平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点．本文介绍了平均报酬模型强化学习的3个...

下载此文

基于神经网络的强化学习研究概述

[期刊论文] 作者：尤树华,周谊成,王辉,, 来源：电脑知识与技术年份：2012

随着强化学习的日益发展,研究越来越深入,将神经网络引入强化学习的研究中已经成为热点课题之一。本文首先介绍强化学习的定义、原理及一般结构,接着简单表述神经网络的基本...

下载此文

深度强化学习中稀疏奖励问题研究综述

[期刊论文] 作者：杨惟轶, 白辰甲, 蔡超, 赵英男, 刘鹏,, 来源：计算机科学年份：2020

强化学习作为机器学习的重要分支,是在与环境交互中寻找最优策略的一类方法。强化学习近年来与深度学习进行了广泛结合,形成了深度强化学习的研究领域。作为一种崭新的机器学...

下载此文

基于深度强化学习的智能博弈对抗关键技术

[期刊论文] 作者：曹雷,, 来源：指挥信息系统与技术年份：2019

阐述了军事智能博弈对抗的发展需求和概念内涵,分析了基于强化学习的博弈对抗特点,并针对智能博弈对抗过程存在的问题,提出了基于深度逆向强化学习、多智能体强化学习、分层...

下载此文

半马氏环境下的逆向强化学习算法研究

[学位论文] 作者：谭传芳,, 来源：哈尔滨工业大学年份：2004

强化学习在智能决策领域有着极其重要的作用。报酬函数作为强化学习的重要元素,通常是凭经验人为设定,不仅缺少理论支持,在面对复杂情况时也有较大的局限性。作为强化学习的...

下载此文

基于异步方法的强化学习研究

[学位论文] 作者：赵星宇,, 来源：中国矿业大学年份：2019

强化学习是一种重要的机器学习方法。强化学习基于动物心理学的相关原理,采取了人类和动物学习中的“尝试与失败”机制,强调在与环境的交互中学习,利用评价性的反馈信息实现决策的优化。...基于异步方法的强化学习是一种最近流行起来的强化学习方法,它采取了不同的智能体并行探索环境的方法,每个智能体独自探索并在线更新全局策略参数。...通过这种方法,缓解了传统强化学习算法收敛缓慢、容易陷入局部极小的问题。但是,在面对离散状...

下载此文

强化学习样本效率理论研究

[学位论文] 作者：张良鹏,, 来源：中国科学技术大学年份：2004

强化学习是机器学习的一个主要分支,主要研究如何让智能体从与环境的交互中推断出最优控制决策。目前的强化学习算法往往需要大量的交互数据才能达到良好的学习效果,这限制了...

下载此文

文本生成领域的深度强化学习研究进展

[期刊论文] 作者：徐聪, 李擎, 张德政, 陈鹏, 崔家瑞,, 来源：工程科学学报年份：2020

谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决...

下载此文

强化学习对信息融合系统的改进

[期刊论文] 作者：范波,潘泉,张洪才,程咏梅, 来源：计算机工程年份：2004

通过分析和研究强化学习的结构和算法,将其引入到信息融合系统中,提出了基于强化学习的信息融合系统,并讨论了它的应用和发展.通过对多智能技术的借鉴,使信息融合系统有进一...

下载此文

强化学习在导弹制导中的应用

[期刊论文] 作者：周锐,陈宗基, 来源：控制理论与应用年份：2001

简述了强化学习的基本原理和特点,讨论了强化学习中评价函数的神经网络近似问题,重点分析了采用多神经网络近似评价函数的学习问题,实现了状态空间或任务的自动分解,提高了评...

下载此文

有关强化学习的若干问题研究

[学位论文] 作者：赵昀,, 来源：年份：2009

强化学习是机器学习领域中的一个重要研究方向。强化学习系统通过对环境反复试探的方式,学习环境状态到可执行动作的最优反应式映射策略,以获取最大回报。相比于其它学习技术...

下载此文

基于深度强化学习的多代理马尔科夫游戏

[期刊论文] 作者：罗舒俊,, 来源：电脑编程技巧与维护年份：2018

深度强化学习在许多复杂的决策问题中都有很好的表现,然而在许多场景下,多代理互动问题带来了对强化学习的挑战。多代理场景作为深度强化学习中的另一个挑战,提出了一种基于...

下载此文

基于模型的层次化强化学习算法

[期刊论文] 作者：郑宇, 罗四维, 吕子昂,, 来源：北京交通大学学报年份：2006

针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题，本文提出基于模型的层次化强化学习算法．该算法采用两层结构，底层利用系统模型，采用...

下载此文

面向信息物理系统的高效深度强化学习算法

[学位论文] 作者：邹启鸣,, 来源：哈尔滨工业大学年份：2020

强化学习算法是机器学习的一个重要分支,主要研究如何利用智能体与外界环境的交互数据学习完成特定任务的控制策略。...由于强化学习算法要求模型能够表征高度复杂的策略,因此利用表现力极强的深度神经网络作为策略表征的深度强化学习算法逐渐成为主流。...虽然深度神经网络较大的参数空间使得深度强化学习算法掌握高度复杂的技能成为可能,但是这也使其学习过程需要大量的交互数据才能够达到良好的学习效果。深度强化学习算法的采样低效...

下载此文

基于强化学习的机械臂控制研究

[学位论文] 作者：王明明,, 来源：年份：2009

将强化学习应用到机械臂控制中,正在成为人工智能领域新的研究热点。强化学习主要是一个“怎样...

下载此文

基于参考模型的输出反馈强化学习控制

[期刊论文] 作者：郝钏钏,方舟,李平,, 来源：浙江大学学报(工学版) 年份：2013

现有的直接策略搜索强化学习控制算法大多是状态完全可观对象设计状态反馈控制策略,其适用的对象范围十分有限.为此,提出一种适用范围更广的模型参考输出反馈强化学习控制算...

下载此文

看过本文同时还关注