搜索与强化学习相关的论文

深度强化学习概述

[期刊论文] 作者：徐松林,, 来源：电脑知识与技术年份：2019

并且随着强化学习的兴起,将深度学习与强化学习算法结合起来,形成深度强化学习算法,并得到了广泛的研究,将其应...

下载此文

基于高斯过程的强化学习算法的研究及实现

[学位论文] 作者：王芳黎,, 来源：武汉理工大学年份：2016

强化学习(Reinforcement Learning)是一种重要的机器学习方法,在人工智能领域有着举足轻重的地位。强化学习算法又分为有模型的强化学习与无模型的强化学习,其中传统的基于模...

下载此文

基于平均报酬模型的强化学习算法研究

[期刊论文] 作者：黄炳强,曹广益,费燕琼,王占全,, 来源：上海理工大学学报年份：2006

对于有吸收目标状态的循环任务，比较合理的方法是采用基于平均报酬模型的强化学习．平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点．本文介绍了平均报酬模型强化学习的3个...

下载此文

基于神经网络的强化学习研究概述

[期刊论文] 作者：尤树华,周谊成,王辉,, 来源：电脑知识与技术年份：2012

随着强化学习的日益发展,研究越来越深入,将神经网络引入强化学习的研究中已经成为热点课题之一。本文首先介绍强化学习的定义、原理及一般结构,接着简单表述神经网络的基本...

下载此文

基于深度强化学习的智能博弈对抗关键技术

[期刊论文] 作者：曹雷,, 来源：指挥信息系统与技术年份：2019

阐述了军事智能博弈对抗的发展需求和概念内涵,分析了基于强化学习的博弈对抗特点,并针对智能博弈对抗过程存在的问题,提出了基于深度逆向强化学习、多智能体强化学习、分层...

下载此文

半马氏环境下的逆向强化学习算法研究

[学位论文] 作者：谭传芳,, 来源：哈尔滨工业大学年份：2004

强化学习在智能决策领域有着极其重要的作用。报酬函数作为强化学习的重要元素,通常是凭经验人为设定,不仅缺少理论支持,在面对复杂情况时也有较大的局限性。作为强化学习的...

下载此文

强化学习样本效率理论研究

[学位论文] 作者：张良鹏,, 来源：中国科学技术大学年份：2004

强化学习是机器学习的一个主要分支,主要研究如何让智能体从与环境的交互中推断出最优控制决策。目前的强化学习算法往往需要大量的交互数据才能达到良好的学习效果,这限制了...

下载此文

文本生成领域的深度强化学习研究进展

[期刊论文] 作者：徐聪, 李擎, 张德政, 陈鹏, 崔家瑞,, 来源：工程科学学报年份：2020

谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决...

下载此文

强化学习对信息融合系统的改进

[期刊论文] 作者：范波,潘泉,张洪才,程咏梅, 来源：计算机工程年份：2004

通过分析和研究强化学习的结构和算法,将其引入到信息融合系统中,提出了基于强化学习的信息融合系统,并讨论了它的应用和发展.通过对多智能技术的借鉴,使信息融合系统有进一...

下载此文

强化学习在导弹制导中的应用

[期刊论文] 作者：周锐,陈宗基, 来源：控制理论与应用年份：2001

简述了强化学习的基本原理和特点,讨论了强化学习中评价函数的神经网络近似问题,重点分析了采用多神经网络近似评价函数的学习问题,实现了状态空间或任务的自动分解,提高了评...

下载此文

有关强化学习的若干问题研究

[学位论文] 作者：赵昀,, 来源：年份：2009

强化学习是机器学习领域中的一个重要研究方向。强化学习系统通过对环境反复试探的方式,学习环境状态到可执行动作的最优反应式映射策略,以获取最大回报。相比于其它学习技术...

下载此文

基于模型的层次化强化学习算法

[期刊论文] 作者：郑宇, 罗四维, 吕子昂,, 来源：北京交通大学学报年份：2006

针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题，本文提出基于模型的层次化强化学习算法．该算法采用两层结构，底层利用系统模型，采用...

下载此文

面向信息物理系统的高效深度强化学习算法

[学位论文] 作者：邹启鸣,, 来源：哈尔滨工业大学年份：2020

强化学习算法是机器学习的一个重要分支,主要研究如何利用智能体与外界环境的交互数据学习完成特定任务的控制策略。...由于强化学习算法要求模型能够表征高度复杂的策略,因此利用表现力极强的深度神经网络作为策略表征的深度强化学习算法逐渐成为主流。...虽然深度神经网络较大的参数空间使得深度强化学习算法掌握高度复杂的技能成为可能,但是这也使其学习过程需要大量的交互数据才能够达到良好的学习效果。深度强化学习算法的采样低效...

下载此文

基于强化学习的机械臂控制研究

[学位论文] 作者：王明明,, 来源：年份：2009

将强化学习应用到机械臂控制中,正在成为人工智能领域新的研究热点。强化学习主要是一个“怎样...

下载此文

基于参考模型的输出反馈强化学习控制

[期刊论文] 作者：郝钏钏,方舟,李平,, 来源：浙江大学学报(工学版) 年份：2013

现有的直接策略搜索强化学习控制算法大多是状态完全可观对象设计状态反馈控制策略,其适用的对象范围十分有限.为此,提出一种适用范围更广的模型参考输出反馈强化学习控制算...

下载此文

深度强化学习在视频游戏中的应用

[学位论文] 作者：邱立威,, 来源：年份：2015

如何直接通过高维感知输入(如视觉、语音等)的学习去控制agents对强化学习来说是一个长期的挑战。这些领域中成功的强化学习应用案例主要依赖于组合人工特征和线性价值函数或...

下载此文

基于智能强化学习的遗传算法研究

[期刊论文] 作者：叶婉秋,, 来源：电脑学习年份：2010

采用结合智能强化学习和遗传算法来求解车间作业调度问题。...

下载此文

DeepMind开源三个深度强化学习框架

[期刊论文] 作者：本刊讯,, 来源：数据分析与知识发现年份：2004

深度强化学习(Deep Reinforcement Learning)一直是近年来人工智能的一些重大突破的核心。尽管深度强化学习取得了很多进展,但由于缺乏工具和库,深度强化学习方法在主流...

下载此文

基于强化学习的动态定价策略研究综述

[期刊论文] 作者：王欣, 王芳,, 来源：计算机应用与软件年份：2019

为了能进一步将强化学习技术应用于动态定价领域,构建智能动态定价系统,对与动态定价相关的强化学习技术进行介绍,将已有...

下载此文

认知无线电机会频谱接入强化学习算法分析

[期刊论文] 作者：董春利,王莉,, 来源：产业与科技论坛年份：2017

然后以代表性的强化学习算法为主线,分析了强化学习算法,重点分析了协作Q学习算法。...

下载此文

看过本文同时还关注