基于深度强化学习的机器人视觉控制技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:shuzhong12miyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人控制作为智能制造和工业4.0的核心组成部分,随着深度学习在视觉任务上的蓬勃发展和强化学习在序列决策领域的应用,结合深度强化学习方法的机器人视觉控制方案具有研究价值。本文围绕深度强化学习领域,开展了基于注意力机制的目标检测算法、基于传统控制理论的策略网络、分步机器人控制方案和端对端机器人控制方案的研究工作,其中:1.针对当前主流深度学习检测框架缺少对候选框空间相关性的利用的问题,提出了基于强化学习和注意力机制的并行目标检测方案。强化学习对当前窗口进行序列变换时,能够获取到相邻时间步中图像的语义相关性,充分利用了高级图像特征中所包含的空间信息;基于注意力机制的状态初始化方案能够显著减少目标检测所需的步数。在公开数据集上的检测结果表明本文提出的方法能够达到准确的检测和分类效果,且产生的候选区域远远少于其他方法;2.针对目前强化学习算法中策略网络结构单一的问题,提出了基于比例-积分控制方法的新型策略网络结构,将强化学习、注意力机制和控制理论结合,能够显著提高算法性能和样本利用效率。该结构对几乎所有的深度强化学习方法都具有通用性。在公开强化学习仿真平台上的实验结果表明,该架构可以实现比目前常用的几种策略网络模型更好的性能;3.针对传统机器人控制方法依赖模型、缺乏鲁棒性等问题,提出了基于深度强化学习的分步控制方案和端对端控制方案,这两种方案均需要视觉输入。分步控制方案将目标检测网络和策略网络经单独训练后再联合训练,但泛化性较差且流程复杂;端对端控制方案只需输入图像即可预测最佳动作,在不同控制任务中均可使用。这两种方案在仿真环境下的实验证明,深度强化学习能使机器人从零开始学会掌握一定的操作技能。本文提出的目标检测方法、PI策略网络和端对端控制方案均具有通用性,除了适合机器人控制任务,也可以应用到其他强化学习任务和视觉任务中。
其他文献
在全国上下轰轰烈烈推进供给侧改革的大背景下,如何弘扬工匠精神正在成为各行各业的焦点话题。不少企业负责人认为,"工匠精神"其实就是,一辈子只做一件事,并把它做到极致,甚至
前不久,哈尔滨市以市委书记王宗璋为团长,副书记董克勇、副市长方世昌为副团长,各区县(市)委书记和部分市直部门负责人组成的学习考察团,先后到粤、浙、鲁三省经济发达地区进
在环保压力日益加大的今天,节能减排已经成为企业增效降本的重要举措之一。11月22日,“纺织之光棉纺织行业节能减排关键技术重点成果推广活动”在河南省新野举办,本次活动由纺织
野外池塘生态养殖商品鳖是我国近年来普遍推广的新型高品质商品养殖技术,特别是目前效益较好的野外商品鳖池塘混养南美白对虾的生态养殖模式,更是目前重点推广的养殖新模式。
背景 全球超过4.22亿成年人患有糖尿病,中国的糖尿病患者约占全球糖尿病患者的四分之一。因此,加强初级卫生保健(Primary Health Care,PHC)系统在管理糖尿病和其他慢性病方面的能力,是国家的优先发展战略。从财政角度来看,中国政府对于初级卫生保健医疗机构的财政补贴由2009年的28亿美元增加到2015年的203亿美元。此外,自2009年医疗改革以来,包括上海在内的中国主要城市实施了
液相色谱技术在生物,医药和环境等众多领域都发挥着重要的作用,为了满足这些领域的分析要求以及解决复杂样品的分析问题,各种分析分离技术相继被开发,色谱柱作为液相色谱分离
4.催产亲鱼的选择 (1)催产用雄亲鱼的选择标准:从头向尾方向轻挤腹部即有精液流出,若精液浓稠,呈乳白色,入水后能很快散开,为性成熟的优质亲鱼;若精液量少,入水后呈线状不散开,则表明尚
本文提出了一种新的物体三维面形测量技术,它在传统的光栅投影测量法的基础上,对待测物体的左右两边分别进行测量,然后将上述的结果进行空间合成。这种方法能够有效地解决目前三
邓小平同志关于科学技术、科技工作的一系列重要论述,是马克思主义在中国发展的新阶段——邓小平理论的极其重要组成部分,是跨世纪新时期我国科技工作的根本指导思想。在实施
为了探索提高养殖户效益的新途径,我们于2010年6-9月在一口5亩的淡水池塘进行了高密度养殖南美白对虾试验,取得了良好的效果,达到了预期的目的。现将养殖情况介绍如下: