基于深度强化学习的水下机械臂自主控制研究

来源 :控制与信息技术 | 被引量 : 0次 | 上传用户:sd63hs63s3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受限于水下环境和观察角度,精确地控制水下机械臂完成水下自主作业任务具有很大的挑战性。针对这一问题,考虑到强化学习算法对环境具有强大的自适应能力,文章提出一种水下机械臂自主控制方法。首先,其设计了一种近端策略优化(PPO)结合行动器-评判器(AC)的强化学习算法训练自主控制策略;其次,对训练过程中出现的稀疏奖励问题,提出了一种基于人工势场法的奖励塑造方法;最后,在仿真试验环境中对基于上述方法训练得到的自主控制策略进行了验证。验证结果表明,该策略可以有效收敛并自主控制水下机械臂向目标位置精确移动,移动快速、过程流畅,末端执行器运动轨迹平滑、稳定。
其他文献
<正>习近平总书记指出,国有企业要做落实新发展理念的排头兵、做创新驱动发展的排头兵、做实施国家重大战略的排头兵。开展“科改示范行动”是贯彻落实习近平总书记关于加强国有企业自主创新能力重要指示精神的重要举措,是深化国企改革、推动技术创新的关键举措。“科改示范行动”作为国企改革专项工程,自2020年4月启动以来,
期刊
当前多源异构的遥感数据在共享方面存在着数据组织差异、数据检索效率低等问题。制定规范化的遥感数据资源目录是大规模遥感数据管理和共享的基础。NASA的统一元数据模型UMM提供了权威的数据映射标准。论文首先基于UMM构建遥感元数据集成模型,并统一遥感元数据的接入规范。设计并实现了基于Elasticsearch的海量遥感数据检索技术,有效解决了多源异构情况下遥感数据资源目录检索效率低下的问题。
期刊
报纸
以成长型景区普者黑与周边社区典型的不均衡发展关系为例,借用溢出效应理论衡量在外扩力与内聚力影响叠加作用下,旅游区对周边社区经济、社会、文化价值的外部性效应,再基于二象对偶理论的动态研究法完善理论结构与测度模型.研究发现,旅游价值溢出是在极化与扩散效应推拉过程中逐渐演化的,旅游价值溢出客观存在且不能忽视负溢出带来的发展剥夺作用,旅游区对周边社区的负外部性形成与忽视系统过程发展有关.为了实现旅游区与社
期刊
以2002年SPOT5影像和2022年的GF1影像为基准,利用随机森林方法对京杭大运河扬州段沿岸1 km范围进行土地利用分类,基于土地利用转换矩阵、土地利用动态度模型和重心迁移模型进行分类后比较。结果表明:20 a间,研究区耕地、林地、水域面积减少,草地、建设用地、未利用地面积增加。耕地为转出面积最多的土地类型,主要转出为建设用地。研究区的综合土地利用动态度为0.63%,整体土地利用类型数量变化相
期刊
辐射环境监测作为国家生态环境监测的重要组成部分,是加强核与辐射安全监管的重要技术支撑,也是提高核安全独立监管权威性和有效性的重要手段。无人系统技术在辐射环境监测领域有着重要的应用。本文综述了国内外无人系统技术、无人系统辐射环境监测技术的发展现状,指出我国生态环保领域无人系统辐射环境监测中存在的问题。针对我国无人系统辐射监测事业发展现状,从行业规划设计和技术论证、基础条件建设、跨行业合作、军民融合、
期刊
在HFETR原有辐射监测平台上,利用PLC和磁盘阵列服务器配合,设计针对HFETR的实时数据采集存储和惰性气体β监测取样电磁阀控制的辐射监测数据采集系统,其中16N监测系统参与反应堆保护功能,避免了原系统因功能较多、负荷较大而可能导致功能丧失等风险。系统调试和堆上试运行结果表明:该设计方案使HFETR辐射监测数据采集系统的数据实时采集监测和电磁阀控制的功能更加稳定有效,提高了HFETR辐射监测数据
期刊
稀土发光材料因稀土元素独特的电子构型而具有特殊的理化性质,可以利用电、光、热等不同手段使其发光,发出的光色明亮,是研究者们广泛研究的对象。目前稀土发光材料在各个领域都占有重要地位,如日常照明、白光LED、荧光温度计、LED显示器、温度传感、生物成像等,虽已经探究出其许多应用和特性,但仍有巨大的发展潜力和研究价值。我们知道,稀土发光材料的基质尤其重要,因为它决定了稀土离子所处的晶格环境,直接影响了最
学位
稀土掺杂的发光材料常用于白光照明领域,以芯片加荧光材料的组合形式制备出的白光LED具有节能、环保等优点。目前,由蓝色芯片和黄色荧光粉(YAG:Ce3+)组成的白光器件已广泛商业化,但其仍存在色温高,显色指数低,荧光粉分布不均匀等缺点。稀土掺杂发光玻璃具有成本低、易塑性、优良的物化性质等优点,用发光玻璃代替荧光粉来制备的白光LED能很好避免上述问题。过渡金属Mn4+离子常常做为红光材料的激活剂,由于
学位
介绍与机器人学习有关的基本概念与核心问题,梳理机器人学习的相关方法和最新进展。依据数据类型,将机器人学习的方法分为基于强化学习的方法、基于模仿学习的方法、基于迁移学习的方法和基于发展学习的方法,并对相关研究进行总结和分析,探讨机器人学习领域目前存在的挑战和未来发展趋势。
期刊