无模型强化学习研究综述

来源 :计算机科学 | 被引量 : 0次 | 上传用户：ntsx888

【摘要】

：

强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算

【作者】

：

秦智慧李宁刘晓彤刘秀磊佟强刘旭红

【机构】

：

北京材料基因工程高精尖创新中心（北京信息科技大学）,北京信息科技大学数据与科学情报分析实验室,中国科学院煤炭化学研究所煤转化国家重点实验室,中科合成油技术有限公司国家能源煤基液体燃料研发中心,中国科学

【出处】

：

计算机科学

【发表日期】

：

2021年3期

【关键词】

：

人工智能强化学习深度强化学习无模型强化学习马尔可夫决策过程

【基金项目】

：

国家重点研发计划（2018YFC0830202）;北京信息科技大学“勤信人才”培育计划项目（2020）;北京信息科技大学促进高校内涵发展——信息+项目-面向大数据的竞争情报分析关键技术研究;北京市教育委员会科技计划一般项目（KM202111232003）;北京市自然基金（4204100）~~

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)和无模型强化学习(Model-free Reinforcement Learning)。模型化强化学习需要根据真实环境的状态转移数据来预定义环境动态模型,随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互。在无模型强

其他文献

秋季莲藕最养人

秋天，许多烦恼困扰着我们，比如皮肤干燥、上火、爱流鼻血、萎靡乏力、咳嗽不停等。秋天不仅是疾病多发的季节，还连接着考验人体免疫力的寒冷冬季。因此，我们必须在秋季调养好身体，为健康过冬打下良好的基础。营养师建议大家，秋季养生不妨吃一些莲藕。　　民间有“荷莲一身宝，秋藕最补人”一说。秋季，天气一向是比较干燥的，根据“燥则润之”之理，建议大家秋季要多吃一些养阴清热、润燥止渴的食品。莲藕具有收缩血管的功能，

期刊

秋季莲藕人体免疫力皮肤干燥寒冷冬季营养师秋天上火

饲喂硫酸铜超标的饲料引起猪中毒病的诊治

硫酸铜是动物饲料中常用的矿物质添加剂，在猪及仔猪饲料中的添加更是不可缺少，但在配制生产饲料的过程中如果超过动物机体实际需要量的添加，就会引起动物机体中毒．若一旦发病，如不

期刊

硫酸铜中毒仔猪饲料动物饲料中毒病诊治超标饲喂矿物质添加剂

广大于天名胜于世——山西省洪洞县广胜寺

广胜寺位于山西省洪洞县城东北17公里的霍山南麓。其为我国著名佛教寺院,是全国重点文物保护单位,始建于东汉建和元年,原名俱庐舍寺,亦称育王塔院,唐代改称广胜寺。元朝时期,

期刊

广胜寺洪洞县山西省全国重点文物保护单位名胜佛教寺院建筑风格元朝时期

6大优势锁定向往、信赖“科农”直达成功科农“白玉蜗牛”项目推介

期刊

白玉蜗牛特种养殖项目有限公司推介优势引种河北省邯郸市技术指导成功

辽宁省档案局通过调研指导和培训全力推进国有企业退休人员人事档案规范化整理和数字化工作

近日,省委办公厅副主任、省档案局局长田富祥带队分别到省建筑设计研究院和沈煤集团,就退休人员人事档案规范化整理和数字化工作情况进行调研指导。调研期间,调研组实地考察

期刊

档案数字化退休人员人事档案辽宁省档案局数字化工作档案规范化档案局局长办公厅副主任

美国种猪场的管理经验

期刊

种猪场猪育种产仔数肉质美系杜洛克新世纪管理经验美国性能平衡

从《黑图档·嘉庆朝》看清代地方档案的移交

本文旨在分析嘉庆年间盛京地区档案的移交工作,选取清代地方档案代表性整理成果《黑图档·嘉庆朝》内的档案为研究的来源,可以发现清代盛京移交的档案可以根据移交的目的

期刊

《黑图档》档案房清代地方档案档案移交档案汇抄盛京内务府盛京将军衙门Hetu Dangsearchiveslocal archives in the

平湖派琵琶在陕西的传承研究

平湖派琵琶是中国近现代琵琶四大流派之一,是重要的琵琶流派艺术。第五代传人李芳园在学习前辈技艺基础上编纂出版的《南北派十三套大曲琵琶新谱》(1895年),标志着平湖派琵琶的形成和创立。平湖派琵琶本是浙江平湖地区的民间艺术,经1956年西安音乐学院建校初期聘用浙江民间艺术家杨少彝先生入校任教开始,使得这一民间艺术在陕西大地落地生根发芽,开启了平湖派琵琶南派北移的新风尚。平湖派琵琶在陕西经历六十余年的院

学位

平湖派琵琶陕西传承

有机硅皮革滑爽剂的制备

本文介绍了八甲基环四硅氧烷在酸性引发剂及各种非离子乳化剂、添加剂的共同作用下进行阴离子聚合的工艺。

期刊

八甲基环四硅氧烷滑爽剂皮革

毛果杨MAP65基因家族的扩张与表达分析

[目的]以林木模式植物毛果杨为研究材料,旨在研究毛果杨MAP65基因家族成员的扩张与表达情况,为MAP65的功能研究提供参考。[方法]利用BLASTP基于Phytozome数据库鉴定毛果杨的M

期刊

毛果杨PtMAP65系统进化分析基因结构

无模型强化学习研究综述

与本文相关的学术论文