基于行动者-评论家方法的船舶路径规划研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:skyfis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,船舶智能化成为航运领域发展的必然趋势,而航线规划技术已经成为智能船舶研究的七大关键技术之一,因此,探索更加优化的船舶路径规划方法对安全与智能化航运的发展具有重要理论价值与实际应用意义。目前,路径规划相关的算法较多,其中大多将规划环境和动作进行离散处理,与实际路径规划特点不太相符,同时,较少根据船舶航行特点进行路径规划,而且进行船舶局部路径规划时,大多数根据其他船舶的航行路线对本船的影响,动态地调整自身路线,从而导致本船的局部路径受他船影响较大等问题。针对这些问题,本文探索了利用深度强化学习中行动者-评论家方法解决连续空间的路径规划问题,并结合船舶航行特点与路径规划需求,对行动者-评论家方法加以改进。主要工作如下:1)基于船舶航行特点的船舶间避碰和静态障碍物避碰方法研究在剖析船舶路径规划特点的基础上,构建了面向船舶路径规划的船舶领域、船舶碰撞危险度模型及其运动参数的计算方法;探索了行动者-评论家方法与路径规划的契合点,重新建立了行动者-评论家方法中的奖励函数,设计了船舶间避碰策略;提出了船舶路径规划环境地图构建方法,并结合船舶领域模型,设计了适用于全局路径和局部路径规划的静态障碍物避碰方法。2)面向船舶避碰的局部路径规划方法研究以安全性和时效性作为船舶局部路径规划目标,将所设计的船舶间避碰策略和静态障碍物避碰方法与多智能体行动者-评论家方法(MADDPG算法)相结合,重新构建了MADDPG中的奖励函数,以实现安全性;针对MADDPG算法收敛速度较低问题,一方面,结合船舶领域和碰撞危险度模型,提出了基于局部更新的Q值计算方法,另一方面,重构了MADDPG算法中经验重放缓冲区,探索了基于混合抽样的高效经验重放方法;设计了基于MADDPG的船舶局部路径规划算法,实现了同时为多船规划局部无碰路径的目的。3)面向安全性和经济性的船舶全局路径规划方法研究以安全性和经济性作为全局路径规划目标,将所设计的静态障碍物避碰方法与单智能体行动者-评论家方法(PPO)相结合,重新设计PPO中的奖励函数,以实现安全性;针对PPO算法在路径规划前期学习盲目性较大,通过扩充算法的起始状态集合,设计了面向全局路径规划的PPO探索策略;设计了基于PPO的船舶全局路径规划算法,实现了安全前提下保证全局规划路径的经济性。4)实验验证与分析选择时效性、安全性和经济性作为评价指标,对本文设计的船舶全局路径和局部路径规划方法及其改进策略进行验证与分析;同时,与其它的船舶路径规划方法进行了实验对比;结果表明本文所提方法能有效规划安全的局部路径、安全和经济的全局路径。
其他文献
三氯生(triclosan,TCS)作为药品和个人护理品中常见的杀菌消毒剂而被广泛应用,因而越来越多的环境介质和生物体中可以检出TCS的存在。污泥中含有较多的TCS,当大量污泥作为农
当前针对机械增压器ZL101A铝合金壳体的再制造修复通常采用脉冲TIG焊接,其中色差法是对其焊接质量检测的方法之一,然而该方法还仅仅是对焊缝宏观表面缺陷的观察。鉴于此,本文主要从对ZL101A铝合金脉冲TIG焊接工艺参数的优化、微观表面形貌对ZL101A铝合金表面色度的影响以及脉冲TIG焊接修复工艺参数对焊缝色度的影响三个方面进行研究,旨在对焊后焊缝与基体之间的色差进行量化,分析色差与焊接质量的关
现阶段无人机(Unmanned Aerial Vehicle,UAV)技术的快速发展使得其在民用和军事中得到了广泛的应用,其中无人机视频回传是无人机系统的一个重要功能。如何在无人机和地面接收端之间进行实现实时高清视频传输是一个很大的难题。现阶段已有的自适应视频流比特率(Adaptive Bitrate,ABR)算法都未考虑根据无人机链路状态进行优化,但是通常由于无人机的飞行状态改变的很剧烈会导致无
泡沫体系具有良好的调剖性能,能通过贾敏效应有效的调控高渗透层。但常规泡沫体系只关注起泡性能,忽略了油水界面张力的影响,体系降低界面张力能力有限,洗油效率较低。此外,
[目的]探讨在HIV阴性肺孢子菌肺炎(PJP)患者中:(1)卡泊芬净联合TMP/SMZ治疗中重度PJP的效果,以及疗效与血浆β-1-3-D葡聚糖(BDG)水平的关系;(2)分析影响HIV阴性PJP患者预后的独立危险因素;(3)比较HIV 阳性患者与HIV阴性患者感染PJP的临床表现区别;(4)分析HIV阴性PJP患者的淋巴细胞亚群特点和预后关系。[方法]回顾性研究北京协和医院2012年1月至201
生物样本库是指标准化收集、处理、储存和应用健康及疾病生物体的生物大分子、细胞、组织和器官等样本以及与这些生物样本相关的临床信息、病理与检验信息、治疗过程与随访信
粉尘作为煤矿井下正常生产过程中产生的五大灾害之一,一直以来都严重威胁着煤矿井下作业人员的身心健康和煤矿井下的安全高效生产,因此,采用多种有效的方法降低井下的粉尘浓度已经成了煤矿日常管理的重点工作之一。本文以山西省潞安集团漳村煤矿28采区回风巷为研究背景,28采区回风巷属于综合机械化掘进巷道,提出了风幕隔尘集尘的方法,论述了风幕隔尘集尘系统依据的相关射流理论和风幕隔尘集尘装置的构造特征。本文采用了理
大跨度桥梁结构对于交通枢纽的联通起着至关重要的作用,具有重要的社会意义和经济价值。我国是大跨、超大跨桥梁结构建设速度最快、建设规模最大的国家之一,保障大跨桥梁结构
机械设备运行时,由于故障状态时间远小于正常状态时间,使得故障样本数量远小于正常样本数量,造成样本间数据不均衡现象。在进行故障诊断时,分类器倾向于将测试样本判别为多数
振动是自然界普遍存在的现象。随着科技水平的不断进步,工程上对设备的运行状态以及运行环境都提出了更高的要求。越来越多的精密仪器被应用于大型工程项目中。精密仪器对低频振动十分敏感,而传统线性隔振器由于空间和稳定性的限制,无法隔绝这些低频振动。由于正负刚度并联的弹簧机构可以呈现较低的动刚度和较高的静刚度,近些年来,很多研究者利用这种低动高静隔振结构来打破传统隔振的限制,实现了高静刚度低动刚度(HSLD)