搜索筛选:
搜索耗时0.1211秒,为你在为你在9,280,000篇论文里面共找到 404 篇相符的论文内容
类      型:
[期刊论文] 作者:徐松林,, 来源:电脑知识与技术 年份:2019
并且随着强化学习的兴起,将深度学习与强化学习算法结合起来,形成深度强化学习算法,并得到了广泛的研究,将其应...
[学位论文] 作者:王芳黎,, 来源:武汉理工大学 年份:2016
强化学习(Reinforcement Learning)是一种重要的机器学习方法,在人工智能领域有着举足轻重的地位。强化学习算法又分为有模型的强化学习与无模型的强化学习,其中传统的基于模...
[期刊论文] 作者:黄炳强,曹广益,费燕琼,王占全,, 来源:上海理工大学学报 年份:2006
对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个...
[期刊论文] 作者:尤树华,周谊成,王辉,, 来源:电脑知识与技术 年份:2012
随着强化学习的日益发展,研究越来越深入,将神经网络引入强化学习的研究中已经成为热点课题之一。本文首先介绍强化学习的定义、原理及一般结构,接着简单表述神经网络的基本...
[期刊论文] 作者:曹雷,, 来源:指挥信息系统与技术 年份:2019
阐述了军事智能博弈对抗的发展需求和概念内涵,分析了基于强化学习的博弈对抗特点,并针对智能博弈对抗过程存在的问题,提出了基于深度逆向强化学习、多智能体强化学习、分层...
[学位论文] 作者:谭传芳,, 来源:哈尔滨工业大学 年份:2004
强化学习在智能决策领域有着极其重要的作用。报酬函数作为强化学习的重要元素,通常是凭经验人为设定,不仅缺少理论支持,在面对复杂情况时也有较大的局限性。作为强化学习的...
[学位论文] 作者:张良鹏,, 来源:中国科学技术大学 年份:2004
强化学习是机器学习的一个主要分支,主要研究如何让智能体从与环境的交互中推断出最优控制决策。目前的强化学习算法往往需要大量的交互数据才能达到良好的学习效果,这限制了...
[期刊论文] 作者:徐聪, 李擎, 张德政, 陈鹏, 崔家瑞,, 来源:工程科学学报 年份:2020
谷歌的人工智能系统(AlphaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决...
[期刊论文] 作者:范波,潘泉,张洪才,程咏梅, 来源:计算机工程 年份:2004
通过分析和研究强化学习的结构和算法,将其引入到信息融合系统中,提出了基于强化学习的信息融合系统,并讨论了它的应用和发展.通过对多智能技术的借鉴,使信息融合系统有进一...
[期刊论文] 作者:周锐,陈宗基, 来源:控制理论与应用 年份:2001
简述了强化学习的基本原理和特点,讨论了强化学习中评价函数的神经网络近似问题,重点分析了采用多神经网络近似评价函数的学习问题,实现了状态空间或任务的自动分解,提高了评...
[学位论文] 作者:赵昀,, 来源: 年份:2009
强化学习是机器学习领域中的一个重要研究方向。强化学习系统通过对环境反复试探的方式,学习环境状态到可执行动作的最优反应式映射策略,以获取最大回报。相比于其它学习技术...
[期刊论文] 作者:郑宇, 罗四维, 吕子昂,, 来源:北京交通大学学报 年份:2006
针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题,本文提出基于模型的层次化强化学习算法.该算法采用两层结构,底层利用系统模型,采用...
[学位论文] 作者:邹启鸣,, 来源:哈尔滨工业大学 年份:2020
强化学习算法是机器学习的一个重要分支,主要研究如何利用智能体与外界环境的交互数据学习完成特定任务的控制策略。...由于强化学习算法要求模型能够表征高度复杂的策略,因此利用表现力极强的深度神经网络作为策略表征的深度强化学习算法逐渐成为主流。...虽然深度神经网络较大的参数空间使得深度强化学习算法掌握高度复杂的技能成为可能,但是这也使其学习过程需要大量的交互数据才能够达到良好的学习效果。深度强化学习算法的采样低效...
[学位论文] 作者:王明明,, 来源: 年份:2009
强化学习应用到机械臂控制中,正在成为人工智能领域新的研究热点。强化学习主要是一个“怎样...
[期刊论文] 作者:郝钏钏,方舟,李平,, 来源:浙江大学学报(工学版) 年份:2013
现有的直接策略搜索强化学习控制算法大多是状态完全可观对象设计状态反馈控制策略,其适用的对象范围十分有限.为此,提出一种适用范围更广的模型参考输出反馈强化学习控制算...
[学位论文] 作者:邱立威,, 来源: 年份:2015
如何直接通过高维感知输入(如视觉、语音等)的学习去控制agents对强化学习来说是一个长期的挑战。这些领域中成功的强化学习应用案例主要依赖于组合人工特征和线性价值函数或...
[期刊论文] 作者:叶婉秋,, 来源:电脑学习 年份:2010
采用结合智能强化学习和遗传算法来求解车间作业调度问题。...
[期刊论文] 作者:本刊讯,, 来源:数据分析与知识发现 年份:2004
深度强化学习(Deep Reinforcement Learning)一直是近年来人工智能的一些重大突破的核心。尽管深度强化学习取得了很多进展,但由于缺乏工具和库,深度强化学习方法在主流...
[期刊论文] 作者:王欣, 王芳,, 来源:计算机应用与软件 年份:2019
为了能进一步将强化学习技术应用于动态定价领域,构建智能动态定价系统,对与动态定价相关的强化学习技术进行介绍,将已有...
[期刊论文] 作者:董春利,王莉,, 来源:产业与科技论坛 年份:2017
然后以代表性的强化学习算法为主线,分析了强化学习算法,重点分析了协作Q学习算法。...
相关搜索: