基于RBF网络Q学习的AUV路径跟踪控制方法

来源 :西北工业大学学报 | 被引量 : 0次 | 上传用户：shmily2

【摘要】

：

水下回收过程中,AUV航行速度受到多种因素影响而产生变化,艉部操纵舵效随之改变,直接影响了AUV回收路径跟踪控制性能。根据AUV航行状态,采用强化学习方法对AUV控制器进行自主学习优化,能够改善AUV航向及深度响应的性能指标,提高路径跟踪控制性能。建立AUV路径跟踪导引律,设计航向及俯仰运动滑模控制器,保证系统对外扰动的鲁棒性;采用Q学习方法,根据AUV航速、跟踪误差及其变化率,对滑模控制参数进行离线训练优化,搭建RBF网络加快训练过程,避免“维数灾”现象;将训练得到的RBF-Q学习网络应用于在线控制,与

【作者】

：

李泽宇刘卫东李乐张文博郭利伟

【机构】

：

西北工业大学航海学院

【出处】

：

西北工业大学学报

【发表日期】

：

2021年3期

【关键词】

：

自主水下航行器路径跟踪强化学习 RBF神经网络

【基金项目】

：

国家自然科学基金(61903304),国家重点研发计划项目(2016YFC0301700)资助。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

壳聚糖/氧化石墨烯改性聚酯非织造布的抗菌及亲水性

为了解决聚酯非织造布无抗菌性和亲水性差的问题,探讨聚酯非织造布经壳聚糖/氧化石墨烯整理后的抗菌和亲水效果。利用静电吸附作用,通过层层自组装技术对聚酯非织造布进行壳聚糖/氧化石墨烯整理,测试聚酯非织造布K/S值、抗菌性、回潮率以及拉伸性能等。通过考察K/S值,定性地分析壳聚糖、氧化石墨烯在非织造布表面组装状态。发现当壳聚糖质量浓度为3 g/mL时,整理后的聚酯非织造布具有良好的抗菌性和亲水性,断裂强力也略有上升。利用层层自组装技术,将壳聚糖/氧化石墨烯整理到聚酯非织造布,可以使其具有优良的抗菌性和较好的亲水

期刊

壳聚糖氧化石墨烯聚酯非织造布抗菌性亲水性

La掺杂SnO2气敏灵敏度的影响机理

为改善La掺杂对SnO₂粉体气敏灵敏度的影响,利用溶胶-凝胶法制备不同La掺杂含量的SnO₂粉体,利用傅里叶红外光谱仪(FT-IR)、透射电镜(TEM)、扫描电镜(SEM)、比表面积及孔径测试仪(BET)以及X射线衍射仪(XRD)等对制得的SnO₂和La掺杂SnO₂粉体进行表征和分析,并测试制得样品的气敏灵敏度。结果表明:La掺杂减小了SnO₂的晶粒粒径。随着La掺杂量的增加,La掺杂SnO

期刊

La掺杂SnO_(2)气敏灵敏度溶胶-凝胶法气敏性

数字化治理视角下陕西省县域政府治理效能

为了契合高效能政府建设以及国家治理能力与治理体系现代化建设的现实需求,为县域政府数字化治理提供有效的评价信息,构建了基于数字化治理的县域政府治理效能评价指标体系,包含6个一级指标、15个二级指标和35个三级指标。采用实地调研法,获取陕西省10个县(区)级政府数字化治理的一手数据,应用信息熵及熵权法展开县域政府治理效能的实证评价与聚类分析。研究结果表明,数字化治理背景下陕西省县域政府治理效能总体评价一般,且在区域水平、维度评价的差异性较大,总体上呈现出“关中较高、陕北次之、陕南最低”的三级阶梯状分布特征。陕

期刊

数字化治理政府治理效能评价县域政府治理熵权法

基于运动约束抑制惯导误差的高速列车隧道内定位方法

高速列车在隧道内卫星信号缺失,仅依靠由微机电(micro-electromechanical systems,MEMS)器件构成的惯性导航系统(inertial navigation system,INS)误差较大。针对这一问题,在不增加额外传感器的情况下,提出一种利用考虑微惯性测量单元(micro inertial measurement unit,MIMU)在列车上安装角的运动约束来抑制INS误差(consider the installation angles for motion constrai

期刊

列车定位隧道运动约束安装角扩展卡尔曼滤波

星载SAR成像与智能处理的单片多处理架构

星载SAR图像智能处理系统需对成像和多种不同任务应用进行在轨实时处理,设计高效专用单芯片多处理器能够有效支持实时性和低功耗的要求,片上数据组织和访存结构是设计重点。分析了SAR成像CSA(chirp scaling)和神经网络VGG-112种典型模型,抽象出遥感图像智能处理过程的协同计算模型。设计了一种带状Tile化数据处理方案及专用多处理架构,提出了一种Tile划分及多Tile同步拼接策略,设计了处理单元之间数据缓存结构,极大降低片外访存带宽,支持多任务模型的并行流水执行。芯片采用28 nm工艺,整体功

期刊

单片多处理器领域专用智能遥感带状数据划分数据填充灵活扩展

西安地区下沉式广场风环境的测试与分析

针对下沉式开放空间在自然通风方式下的局限性,在西安市冬季阴天、晴天2种天气条件下对商区导入型和中庭广场型下沉式广场的地面入口与广场内的风环境及其风速、温度、湿度等参数进行测量。从城市街区人行高度的行为舒适度、空气质量舒适度、热舒适度等3方面评价下沉式开放广场的风环境。结果表明:在满足行为舒适和热舒适前提下,中庭广场型下沉式广场的风环境舒适度更高;下沉空间内的风速均小于地面入口区域,商区导入型下沉广场的风环境质量更好。

期刊

下沉式广场风环境空气质量人行高度热舒适度

基于直方图滤波的浅海声源测距算法研究

针对浅海移动声源的测距,提出了基于直方图滤波的水下测距算法。该算法以声传播过程中传播损失和目标运动参数以及接收信号作为先验知识,对声源位置函数形成的状态向量进行更新,从而实现浅海声源的测距,并用SwellEx-96实测海试数据库进行了算法的实验验证。结果表明:对移动声源的测距深度误差较小,而探测的水平距离在10 km范围时,水平距离最大测距误差在±10 m,并且可以通过改善目标运动参数等先验知识提高对声源测距的精度,验证了直方图滤波算法可较好地实现对水下移动目标的测距。

期刊

水下测距浅海声源统计模拟方法声场建模概率密度直方图滤波

直升机易损性指标分配与实现方法研究

为降低武装直升机在破片/弹丸打击下的易损性,主要研究在单次和多次打击下由整机向关键部件的易损性指标分配方法。通过将单次打击同一方向上的系统部件划分为非余度不重叠、非余度重叠以及重叠余度3种情况,提出基于关键部件迎弹面积比例和关键部件易损性评估结果比例的2种指标分配方法;通过将多次打击下的系统部件划分为余度部件和非余度部件,提出基于关键部件易损性结果比例的指标分配方法。在此基础上,结合武装直升机的易损性减缩措施,通过迭代分析实现对应部件的易损性指标要求。对AH-64D直升机进行单次和多次打击下的数值仿真试验

期刊

指标分配易损性评估易损性减缩易损性武装直升机

面向CPU-GPU集群的分布式机器学习资源调度框架研究

随着GPU硬件设施的广泛应用,越来越多的分布式机器学习应用程序开始使用CPU-GPU混合集群资源来提高算法的效率。但是,现有的分布式机器学习调度框架要么只考虑CPU资源上的任务调度,要么只考虑GPU资源上的任务调度,即使综合考虑CPU与GPU资源的不同,也很难提高整个系统的资源使用效率,即使用CPU-GPU集群进行分布式机器学习作业面临的关键挑战是如何高效地调度作业中的任务。在对现有的方法进行分析后,提出了一种基于不均匀数据分片的策略,利用线性规划的原理,使得CPU任务时间与GPU任务时间尽可能接近,从而

期刊

异构任务一体化调度聚类算法分布式

纵向数据缺失和辅助信息下分位数回归模型的估计

利用逆概率加权方法和经验似然方法,研究纵向数据缺失和辅助信息下的分位数回归模型的估计与推断问题。给出了线性分位数回归模型的参数估计及其渐近正态性,定义了分位数回归模型的加权经验似然估计;在一定条件下证明了所得估计的渐近正态性,建立了估计的渐近理论。通过数值实验说明了所得估计的有效性。

期刊

分位数回归模型纵向数据缺失辅助信息经验似然逆概率加权

基于RBF网络Q学习的AUV路径跟踪控制方法

与本文相关的学术论文