深度强化学习在Atari视频游戏上的应用

来源 :电子世界 | 被引量 : 0次 | 上传用户:zsz520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考虑到深度学习在图像特征提取上的优势,为了提高深度学习在Atari游戏上的稳定性,在卷积神经网络和强化学习改进的Q-learning算法相结合的基础上,提出了一种基于模型融合的深度神经网络结构。实验表明,新的模型能够充分学习到控制策略,并且在Atari游戏上达到或者超出普通深度强化学习模型的得分,验证了模型融合的深度强化学习在视频游戏上的稳定性和优越性。
其他文献
目的探讨超声造影在子宫破裂术前诊断及术后评估子宫破裂程度与子宫修复中的临床应用价值。方法应用常规超声及超声造影对5例子宫破裂患者进行检查,对比分析术前与术后声像图
驯化是人类在生存、发展过程中,所掌握的“及依靠自然、又摆脱自然”一种生存本领,具有漫长的历史。本文通过对驯化定义、驯化的特征、驯化过程及其变化等问题的讨论,阐述驯化对
在分析电动机的过载特性、热继电器的保护特性及其相互配合和对起动过程影响的基础上 ,提出了低压笼型电动机在有载或重载起动时的改进控制线路 ,以实现对电动机的有效保护
结合工作实践经验论述了采用装配式的施工方法不但可以节约大量支架和模板,降低劳动强度,加快施工进度,确保工程质量。因此,目前国内外对于申小跨径的桥梁,装配式钢筋混凝土简支梁
科学技术与文学相互影响,且随着科学技术的发展和文学艺术的繁荣,相互影响日益加大.本论述从科学技术增加了文学的载体、丰富了文学的内容、扩大了文学的创作群体、调整了文
对于变压器油中局部放电超高频测量系统所得到的局部放电的特征量,首先,选择优先权较高的6个特征量作为自适应神经模糊推理系统(ANFIS)的输入量,其次,构建6输入单输出的ANFIS
随着我国市政道路事业的发展,既有市政道路逐渐不能满足交通需求,需要进行拓宽改造,但在改造过程中容易产生纵向裂缝。文章结合市政道路改造施工经验,分析了产生纵向裂缝的原
护理工作是医疗过程中的重要组成部分,而临床护理观察是护理工作中一项极为重要的内容,在护理观察领域里,护理人员起着直接的主导作用,可通过观察病人每时每刻发生的病情变化
本文将互信息模型引入教育数据关联模式挖掘,提出一种基于互信息的教育数据矩阵加权正负关联模式挖掘算法,给出与其相关的定理及其证明。本文算法克服了现有挖掘算法的缺陷,
中国古代的道家学说内容博大精深又富于哲理和神秘性。上世纪80年代,美国《纽约时报》把老子列为世界古今十大作家之首,这说明老子的五 Ancient Chinese Taoism doctrine is