深度强化学习在图像辅助控制及图像分类中的应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:f654753936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,深度学习和强化学习中一些先进方法的出现使得两者的结合成为可能,其产物就是深度强化学习。深度强化学习既有继承于深度学习的强泛化和自特征提取能力,又可以像强化学习方法一样,使智能系统通过自我的试错在给定环境中学习解决特定任务的策略。深度强化学习的诞生在人工智能领域影响重大,相关工作随之涌现,一些成功的深度强化学习算法甚至能够在游戏和机器控制中超过人类的表现。然而,现有的深度强化学习算法仍然存在一些不足和空白。在应用深度方面,现有算法无法在连续动作空间中进行多任务学习,并且大部分算法只能学习简单的任务。在应用广度方面,算法在计算机视觉领域中,特别是图像分类问题中的应用还非常少。本文介绍的就是从这两个方面出发,阐述对深度强化学习在图像辅助控制和图像分类问题中的应用研究。本文共提出三个算法,即multi-DDPG算法、h-DDPG算法和自强化网络算法,前两个用于实现连续动作空间中图像辅助下的多任务学习和层次性学习,后一个则针对图像分类问题。在multi-DDPG算法中有一个值网络和多个策略网络,其中每一个策略网络负责学习一个任务,而值网络则负责训练策略网络。在h-DDPG算法中,这个结构被扩展为一个具有两个值网络和多个策略网络的结构,增加的一个值网络可以通过组合策略网络的方式来进行复杂任务的学习。最后,自强化网络算法尝试将深度强化学习应用于图像分类问题中,算法中有一个特征决策智能系统,它控制着各个输入图像的分类时刻,对于还不能分类的图像,它会选择一种图像变换,并将变换后的图像返回给图像分类网络进行再次分类。实验结果显示,本文中提出的三个算法都在各自的任务中有着不错的性能。其中,multi-DDPG算法能够在多任务学习中学习到与单任务学习算法性能相当的任务解决策略,其性能也不会因为任务数量或条件的增加而受到影响。而h-DDPG算法则可以非常高效地同时学习简单的动作技能以及复杂任务的解决策略,其解决复杂任务的能力甚至超过了一些针对离散动作空间的算法。最后的自强化网络算法则能够通过特征决策智能系统的决策将图像分类网络原本的错误率降低18.82%。
其他文献
由于传统的高师音乐技巧课评分方式存在着种种问题,所以有必要对其进行改革。即,将传统的一分制改为多分制,由笼统打分向分项打分改革。改革后,做到具体问题具体分析、具体评
本文主要介绍了冶金机械加工设备——俄罗斯220#镗铣床电控系统改造。通过对机床的现状分析,选择了具体改造方案并加以实施,并对改造后的设备加以效果检查以及改造后设备取得的
人像摄影的构图的技巧中。主要包括景别的选择、角度的选择、构图形式选用、以及人物姿势的选用。人像摄影构图的手段主要是通过景别、角度、姿势的选用,从而合理的安排和组织
目的观察施贵宝敷料联合应用喜辽妥预防经外周静脉置人中心静脉导管所致机械性静脉炎的效果。方法把60例留置中心静脉导管的患儿,根据其置管的时间顺序划分为对照组及实验组,每
目的探讨子宫肌瘤的疗效及安全性,观察治疗效果及血清激素水平变化。方法选取2012年10月至2013年10月在我院治疗的58子宫肌瘤患者列为研究对象,进行回顾性分析。随机进行分组