基于SAC算法的四旋翼无人机姿态控制

来源 :第三十四届中国仿真大会暨第二十一届亚洲仿真会议 | 被引量 : 0次 | 上传用户：wj0987654321

【摘要】

：

【作者】

：

唐腾任双印王春江

【机构】

：

电子科技大学自动化工程学院

【出处】

：

第三十四届中国仿真大会暨第二十一届亚洲仿真会议

【发表日期】

：

2022年01期

【关键词】

：

四旋翼无人机姿态控制强化学习 GymFC Soft Actor Critic

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,飞行器控制向智能化发展,将深度强化学习应用于飞行器控制成为备受关注的热门话题。针对此话题,采用基于深度强化学习算法Proximal Policy Optimization和Soft Actor Critic的四旋翼无人机姿态控制策略设计方法,在仿真环境GymFC中进行实验,通过与环境的交互,智能体根据奖励信息优化神经网络参数,使其能够获取最大化的累积奖励。奖励值计算根据参考指令跟踪情况设计,经过训练之后两种策略基本都能实现目标指令的跟踪,但在性能上存在差异。对比分析两者在无人机姿态控制上的表现,可以发现基于Soft Actor Critic的控制策略性能更优。

其他文献

文化润疆视域下喀什大学学生文化自信培育探究

文化润疆既是一项和风细雨、润物无声的系统工程，也是一条培育文化自信的实现路径。在文化润疆视野下，深度思考文化润疆工程的实施对喀什大学学生文化自信的培育所提供的模式和路径的借鉴是现实之需。文章通过对文化润疆的价值意蕴的分析，认为文化润疆工程的实施将为喀什大学学生文化自信培育从文化资源、模式借鉴、环境营造等方面提供难得的机遇，同时提出要通过用好各类文化资源，营造良好文化自信培育氛围；有的放矢，强化文化

期刊

文化润疆大学生文化自信培育

考虑壁面湿润性的多孔介质两相渗流特性数值研究

选取福州某地原状花岗岩残积土作为研究对象，基于计算机断层扫描（CT）技术与Level Set方法，研究孔隙壁面湿润性对多孔介质水-气两相渗流特性的影响情况。结果表明：不同湿润性条件下，驱替过程均有细观“指进”现象，界面前缘形状主要以凸弧形驱进，凹弧形仅存在于渗流初期；孔隙壁面的湿润性对两相渗流过程影响较大，疏水壁面（θ＞90°）会对流体产生排斥加速作用，亲水壁面（θ＜90°）会对流体产生黏滞减速效

期刊

多孔介质Level Set计算机断层扫描两相流湿润性

重拳下违法采砂渐“归零”

报纸

长江采砂恢复性司法理念采砂船上海市水务局非法采砂联勤联动机制

浅析高质量标准化体系在现代汽车企业中的作用

以车企为例,指出了高质量标准化体系在现代化企业中的作用,即助推新技术研发、降本增效、引领行业潮流、参与国际竞争及交流等。

期刊

标准质量车企

急性缺血性脑卒中静脉溶栓护理指南

目的制订《急性缺血性脑卒中静脉溶栓护理指南》，作为实施急性缺血性脑卒中静脉溶栓护理的指导工具，以规范溶栓治疗的护理行为。方法严格按照循证护理实践指南制订的方法，构建《急性缺血性脑卒中静脉溶栓护理指南》草案，采用临床指南研究与评估系统目录Ⅱ对指南草案进行专家评审，根据专家评审结果和建议对指南进行修改，形成正式指南。结果构建的指南推荐意见涵盖了院内组织管理、病情观察、并发症的观察与处理、体位与离

期刊

急性缺血性脑卒中静脉溶栓护理实践循证护理学指南

人类命运共同体视域下我国高等教育“走出去”的现状、价值坐标与战略图景

基于人类命运共同体理念，从其战略格局、价值导向和方法论等三个维度建立起新时期我国高等教育“走出去”的理论与实践分析框架。当前我国高等教育在“走出去”办学中还存在着战略格局不够，办学层次较低；价值导向不明，综合办学效益低；缺乏先进方法论指导，呈碎片化发展状态等问题。在人类命运共同体理念的指引下，高等教育在“走出去”过程中要坚持公正平等的合作观，坚持互利共赢的利益观，秉持辩证先进的方法论。并从提升战略

期刊

高等教育“走出去”现状价值坐标战略图景

变形飞行器深度强化学习姿态控制方法研究

针对变形飞行器动力学模型非线性强、不确定性大，以及变形引起模型变化范围大的问题，基于双延迟深度确定性策略梯度算法提出了一种深度强化学习姿态控制方法。首先，基于多刚体系统建立了变形飞行器动力学模型，然后在马尔可夫决策过程的框架下设计了算法所需状态空间、动作空间以及奖励函数，通过在状态空间中引入姿态跟踪误差历史信息，进一步提高了控制精度，并将策略网络与传统PD控制结合形成复合控制器，提高了算法训练效率

期刊

变形飞行器深度强化学习双延迟深度确定性策略梯度姿态控制

脑卒中患者吞咽障碍的饮食护理及康复训练指导效果

目的：探究对存在吞咽障碍的脑卒中患者，给予饮食护理与康复训练指导的价值。方法：依据随机抽样原则对脑卒中患者70例分组，常规护理者为对照组，饮食护理联合康复训练指导者为观察组，统计干预效果相关指标。结果：经治疗及护理干预后，观察组患者中吞咽功能1级率明显高于对照组，且3级与3级率均小于对照组，组间对比有差异性；经不同方案干预后，观察组所有患者吞咽功能障碍均得到缓解，对照组中6例患者吞咽功能未见改善，

期刊

脑卒中吞咽障碍饮食护理康复训练指导

竹林七贤的不同选择

＜正＞竹林七贤聚饮时，谈玄清议，吟咏唱和，纵酒昏酣，遗落世事，我行我素。但他们的政治态度及应付环境的方法各不相同，最后结局也不一样。他们生活的时代，基本是曹魏政权开始受到司马家族威胁并面临改朝换代的时期。七贤中最具代表性的是嵇康，他打出“越名教而任自然”的旗号，公开蔑视礼教，鄙薄世俗，毫无顾忌，胆识惊人，

期刊

非侵入性脑刺激治疗脑卒中后认知障碍的研究进展

认知障碍是脑卒中患者最常见的并发症之一。它不仅严重影响了患者的生存质量，而且增加了再次患病的风险。非侵入性脑刺激技术（NIBS）是一种安全性高、疗效好、副作用少的新型康复技术，在脑卒中后认知障碍（PSCI）的治疗中具有良好的应用前景，其中具有代表性的经颅磁刺激（rTMS）和经颅直流电刺激（tDCS）在目前的临床应用中已显示出良好的疗效，但对其治疗方案和疗效尚无共识。因此，本文就rTMS和tDCS治

期刊

脑卒中非侵入性脑刺激认知障碍重复性经颅磁刺激经颅直流电刺激

基于SAC算法的四旋翼无人机姿态控制

与本文相关的学术论文