搜索与强化学习相关的论文

深度强化学习综述（英文）

[期刊论文] 作者：王浩楠,刘苧,章艺云,冯大伟,黄峰,李东升,张一鸣, 来源：null 年份：2020

深度强化学习已成为人工智能研究中最受欢迎的主题之一,已被广泛应用于端到端控制、机器人控制、推荐系统、自然语言对话系统等多个领域。...本文对深度强化学习算法和应用进行系统分类,提供详细论述,并将现有深度强化学习算法分为基于模型的方法、无模型方法和高级深度强化学习方法。之后,全面分析探索、逆强化学习和迁移强化学习等高级算法的进展。...最后,概述当前深度强化学习的代表性应用,并分析4个亟待解决的问题。...

下载此文

多智能体分层强化学习综述

[期刊论文] 作者：殷昌盛,杨若鹏,朱巍,邹小飞,李峰, 来源：智能系统学报年份：2020

作为机器学习和人工智能领域的一个重要分支,多智能体分层强化学习以一种通用的形式将多智能体的协作能力与强化学习的决策能力相结合,并通过将复杂的强化学习问题分解成若干...

下载此文

深度强化学习中的随机算法研究

[学位论文] 作者：汪跃,, 来源：北京交通大学年份：2020

近年来,深度强化学习通过结合强化学习和深度学习技术,已经在许多序列决策问题中成功应用,如围棋,电子游戏,机器人控制,自动对话系统等。强化学习通过将实际中的序列决策问题...

下载此文

面向连续动作空间的深度强化学习算法研究

[学位论文] 作者：陈红名,, 来源：苏州大学年份：2020

近些年来,深度强化学习算法在很多强化学习任务上取得了令人瞩目的表现。深度强化学习算法集合了深度学习的表征能力和强化学习的自主决策能力,被认为是通向通用人工智能的必...

下载此文

多Agent深度强化学习综述

[期刊论文] 作者：梁星星, 冯旸赫, 马扬, 程光权, 黄金才, 王琦, 周玉, 来源：自动化学报年份：2020

近年来,深度强化学习(Deep reinforcement learning,DRL)在诸多复杂序贯决策问题中取得巨大突破.由于融合了深度学习强大的表征能力和强化学习有效的策略搜索能力,深度强化学...

下载此文

结合多元关系的深度强化学习算法研究

[学位论文] 作者：耿宇豪, 来源：东南大学年份：2020

深度强化学习（DRL）结合了深度学习的感知能力和强化学习的决策能力，从而能够处理传统强化学习难以解决的复杂决策问题。然而，深度强化学习模型仍面临着样本利用率低、对环境的微小变化泛化性不足等局限。...这些局限性主要体现在深度强化学习往往会过度拟合训练数据，进而无法解决具有复杂逻辑和关系结构的问题。针对上述问题，DeepMind 在 18年提出了新的关系强化学习（RRL）算法。...

下载此文

模型化强化学习研究综述

[期刊论文] 作者：赵婷婷,孔乐,韩雅杰,任德华,陈亚瑞, 来源：计算机科学与探索年份：2020

深度强化学习(DRL)作为机器学习的重要分支,在AlphaGo击败人类后受到了广泛关注。DRL以一种试错机制与环境进行交互,并通过最大化累积奖赏最终得到最优策略。强化学习可分为...

下载此文

强化学习算法与应用综述

[期刊论文] 作者：李茹杨,彭慧民,李仁刚,赵坤,, 来源：计算机系统应用年份：2020

强化学习是机器学习领域的研究热点,是考察智能体与环境的相互作用,做出序列决策、优化策略并最大化累积回报的过程.强化学习具有巨大的研究价值和应用潜力,是实现通用人工智...

下载此文

深度强化学习中稀疏奖励问题研究综述

[期刊论文] 作者：杨惟轶, 白辰甲, 蔡超, 赵英男, 刘鹏,, 来源：计算机科学年份：2020

强化学习作为机器学习的重要分支,是在与环境交互中寻找最优策略的一类方法。强化学习近年来与深度学习进行了广泛结合,形成了深度强化学习的研究领域。作为一种崭新的机器学...

下载此文

基于经验重放的深度强化学习算法研究

[学位论文] 作者：陈松,, 来源：苏州大学年份：2020

深度强化学习算法研究是近年来机器学习领域的一个研究热点。经验重放机制是深度强化学习算法中的一项重要技术,如何提高样本利用率并解决经验重放的固有缺陷是深度强化学习...

下载此文

基于强化学习的自然语言处理技术

[期刊论文] 作者：冯少迪,, 来源：数码世界年份：2020

深度强化学习是人工智能领域的研究热点.深度强化学习是以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出...

下载此文

主动探索强化学习算法研究

[学位论文] 作者：赵东方, 来源：哈尔滨工业大学年份：2020

强化学习是机器学习的一个重要分支,是一种从与周围环境交互中学习的计算方法。强化学习关注未知环境中智能体实现目标的顺序决策,广泛应用于自然语言处理,机器人控制等领域。...区别于传统的机器学习算法,强化学习智能体在与环境的交互过程中获取样本并实现策略学习,同时,智能体需要为交互付出时间和空间的开销。...特别是应用于控制系统的强化学习算法,过多的交互会使环境发生改变甚至给智能体和环境带来损伤。因此,能够用最少的...

下载此文

智能制造领域中深度强化学习的应用综述

[期刊论文] 作者：吕金旭, 葛万成, 来源：信息与电脑(理论版) 年份：2020

深度强化学习在智能制造领域具有广泛的应用前景。...文章概述了相关文献的综述，总结了深度强化学习在智能制造领域的几个主要应用方向，如自动化控制、智能优化调度、故障预测与维修、品质控制与质量预测以及智能物流和供应链管理。...在这些领域，深度强化学习利用深度学习网络和强化学习算法，能够实现更高效、更精准、更智能化的制造过程控制和管理。同时，探讨了深度强化学习在智能制造中面临的挑战和未来发展方向。这些研究对推动智...

下载此文

强化学习可解释性基础问题探索和方法综述

[期刊论文] 作者：刘潇, 刘书洋, 庄韫恺, 高阳, 来源：软件学报年份：2020

强化学习是一种从试错过程中发现最优行为策略的技术,已经成为解决环境交互问题的通用方法.然而,作为一类机器学习算法,强化学习也面临着机器学习领域的公共难题,即难以被人理解.缺乏可解释性限制了强化学习在安全敏感领域中的应用...,如医疗、驾驶等,并导致强化学习在环境仿真、任务泛化等问题中缺乏普遍适用的解决方案.为了克服强化学习的这一弱点,涌现了大量强化学习可解释性（explainable reinforce...

下载此文

文本生成领域的深度强化学习研究进展

[期刊论文] 作者：徐聪, 李擎, 张德政, 陈鹏, 崔家瑞,, 来源：工程科学学报年份：2020

谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决...

下载此文

人工智能深度强化学习的原理与核心技术探究

[期刊论文] 作者：吴英萍耿江涛, 来源：理论与创新年份：2020

【摘要】应用大数据技术的深度学习及深度强化学习是人工智能领域的一场革命，深度学习使强化学习能够处理以前难以解决的问题，取得了令人瞩目的进步，特别是在游戏和棋类竞技等领域都超过了人类的表现。...本文介绍了强化学习的一般领域，然后介绍了基于价值和基于策略的方法和深度强化学习中的核心算法，进一步表现了深层神经网络融入强化学习的独特优势。　　...【关键词】强化学习;深度学习;深度强化学习;人工智能　　引言　　近...

下载此文

完全合作类多智能体深度强化学习综述

[期刊论文] 作者：赵立阳, 常天庆, 褚凯轩, 郭理彬, 张雷, 来源：计算机工程与应用年份：2020

作为机器学习和人工智能领域的重要分支之一，完全合作类多智能体深度强化学习以一种通用的方式将深度强化学习的表达决策能力和多智能体系统的分布协作能力有效结合，为完全合作类多智能体系统中的无模型序贯决策问题提供了一种端对端的解决方案...首先，对深度强化学习的基本原理进行阐述，并从基于值函数、基于策略梯度和基于演员-评论家三个主要方向对单智能体深度强化学习的发展进行了总结；其次，分析了多智能体深度强化学习面...

下载此文

基于深度强化学习的量化投资策略研究

[学位论文] 作者：孙洪永,, 来源：电子科技大学年份：2020

量化投资已经成为强化学习领域的研究热点,特别是股票、外汇和期货等方面具有广泛的应用需求和学术研究意义。...基于深度强化学习构建的量化投资策略可以随时根据金融市场的变化进行自主调整,实现感知市场变化并进行决策,使量化投资实现智能化。...本文基于深度强化学习对量化投资策略进行研究,主要完成了以下工作:(1)基于深度强化学习实现量化投资,针对前期策略训练效率低、训练时间长的缺点提出裁剪PPO进行改进。保留标准P...

下载此文

面向信息物理系统的高效深度强化学习算法

[学位论文] 作者：邹启鸣,, 来源：哈尔滨工业大学年份：2020

强化学习算法是机器学习的一个重要分支,主要研究如何利用智能体与外界环境的交互数据学习完成特定任务的控制策略。...由于强化学习算法要求模型能够表征高度复杂的策略,因此利用表现力极强的深度神经网络作为策略表征的深度强化学习算法逐渐成为主流。...虽然深度神经网络较大的参数空间使得深度强化学习算法掌握高度复杂的技能成为可能,但是这也使其学习过程需要大量的交互数据才能够达到良好的学习效果。深度强化学习算法的采样低效...

下载此文

深度强化学习算法与应用研究现状综述

[期刊论文] 作者：刘朝阳, 穆朝絮, 孙长银, 来源：智能科学与技术学报年份：2020

深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。...概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。...最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。...

下载此文

看过本文同时还关注