分层强化学习研究综述

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:fugle0908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.但是,强化学习一直被“维数灾”问题所困扰.近年来,分层强化学习方法引入抽象(Abstraction)机制,在克服“维数灾”方面取得了显著进展.作为理论基础,本文首先介绍了强化学习的基本原理及基于半马氏过程的Q-学习算法.然后介绍了3种典型的单Agent分层强化学习方法(Option、HAM和MAXQ)的基本思想,Q-学习更新公式,概括了各方法的本质特征,并对这3种方法进行了对比分析评价.最后指出了将单Agent分层强化学习方法拓展到多Agent分层强化学习时需要解决的问题.
其他文献
作文选材立意从抒写情感角度来看,不外乎亲情、温情和真情,如果我们能从小事细节上入手,拓深其思想情感内涵,以小见大,文章一定会新颖生动、立意深刻,富有表现力和感染力。亲
2009年是我国实施“十一五”规划的关键之年,也是进入新世纪以来我国经济发展最为困难的一年。作为应对金融危机、服务经济社会发展、落实中央“保增长、保民生、 2009 is t
奶奶最喜欢在庭院前,望着天空发呆。而我,总是望着奶奶发呆。“奶奶,你在看什么?”我问。“在看星星。”奶奶轻声回答。“星星?”我错愕,小声嘀咕道,“那有什么好看的?”“我
【1】张起灵离开之后,吴邪关了西湖边的古董铺子,遣走了店伙计王盟,从床头柜的最底层翻出那张薄薄的银行卡。那里面是他近十年的积蓄。吴邪自称小奸商,看着积累了那么久的钱
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
一、夏季在沼气池内窒息中毒预防与急救  1、建造离地面比较浅的沼气池。尽量避免下池操作,把沼气池的深度控制在2米以内。这样,清除池内的沉渣可以在池外进行。万一进入池内发生危险时也便于抢救。  2、入池前,一定要把池内沼液抽走,使液面降至池壁上进、出料口以下,充分通风,放净沼气。先把鸡、鸭、兔等小动物放进去试验,证明确实没有危险后,再下池操作。  3、下池工作时,池上要有人守护。下池工作的人员要系上
职业中专的学校逐渐发展,也越来越重视各个专业的课程改革,学前教育 专业作为当前非常迫切和紧要的专业,其课程改革是非常重要的.学前教育的课程改革最重要的是进一步将专业
高职院校在英语教学改革中采用分层教学的模式有利于推动素质教育改革,符合现代教育的标准,使得每一个层次的学生都能够尽快掌握英语学习的能力,提升英语学习的水平,因此我们
采用FLAC3D数值模拟软件对井采状态下不同开采方向(顺坡,逆坡)对边坡稳定性进行研究对比.研究结果表明:露天开采过后,坡体基本处于稳定状态,转入地下开采之后,随着推进长度的
分布式数据备份与传统的数据复制有很大的区别。它将一具数据源的某些或全部拷到另一个或另一些地方。传统的数据备份介质为磁带或磁盘,而今网络成了首选介质。任何技术都是一