记忆增强型深度强化学习研究综述

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:elong_ctu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点.本文根据记忆增强型神经网络类型,将记忆增强型深度强化学习分为了4类:基于经验回放的深度强化学习、基于记忆网络的深度强化学习算法、基于情景记忆的深度强化学习算法、基于可微分计算机的深度强化学习.同时,系统性地总结和分析了记忆增强型深度强化学习的一系列研究成果存在的优势和不足.另外,给出了深度强化学习常用的训练环境.最后,对记忆增强型深度强化学习进行了展望,指出了未来研究方向.
其他文献
目的:探讨腹腔镜手术联合来曲唑治疗子宫内膜异位症的临床效果.方法:选择2014年3月到2016年1月赤峰市医院收治的子宫内膜异位症患者90例作为此次研究对象,把全部患者随机分成
会议
目的: 对比分析右美托咪定与丙泊酚用于小儿腹股沟斜疝手术麻醉的效果. 方法: 选择2013年7月~2015年7月于本院收治的需进行腹股沟斜疝手术的患儿60例,随机分为试验组
会议
无痛性慢性便血是小儿直肠及结肠息肉的主要症状,便血发生在排便终了时,呈鲜红色,不与粪便相混,量较少,由于息肉脱落引起大量出血者罕见。有时在粪便的血迹处,可见一条状压痕,为息肉
目的: 研究分析带锁髓内钉与锁定加压钢板治疗肱骨骨干骨折的临床效果. 方法: 选取本院骨外科2012年2月至2014年5月70例肱骨骨干骨折的病例作为研究对象,使用带锁髓
会议
慢性肾衰竭患者的治疗目的是提高生活质量及降低死亡率,当肾衰竭达到一定程度时,药物治疗效果有限,维持性肾替代治疗是确切有效的一种方式,发展至今,血液透析仍然是终末期肾病患者
会议
Endoscopic submucosal dissection (ESD) enables direct submucosal dissection so that even large early-stage gastrointestinal tumors can be resected en bloc . ESD
洛克希德·马丁公司(以下简称"洛马")是美国一家拥有百年历史的国防承包商,在百年发展历程中,洛马以美国国家安全需求为牵引,逐渐成长为世界最大军工集团。伴随网络时代的来临和新安全威胁的涌现,洛马加大网络空间作战技术的研发力度和资金投入,为美国加强网络国防能力建设铸剑护航。研究以洛马网络军工产业发展为脉络,对其网络安全全谱能力进行了综合梳理;同时,多角度分析了其创新的发展路径。
目的:探讨总结手术治疗妊娠合并卵巢肿瘤的临床效果.方法:对本院2013年10月至2015年3月期间收治的40例接受手术治疗妊娠合并卵巢肿瘤孕产妇的临床治疗效果,进行回顾性统计分
会议
计算机棋类游戏学习中的自对弈学习指仅依赖行棋过程及最终的输赢结果的学习.整个过程中除下棋规则外不预设任何领域知识,也无专家指导.虽然基于极大极小算法、α-β剪枝算法
目的:分析在粘连性肠梗阻治疗中应用腹腔镜下粘连松解术的临床疗效.方法:选择2015年2月至2016年2月本院接收治疗的粘连性肠梗阻患者70例为研究对象,分为观察与对照两组,各35
会议