基于强化学习的飞行自动驾驶仪设计

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:huang267321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;其次,构建了BP神经网络,通过飞行过程中的立即奖赏,更新网络的值函数映射;最后,通过数字仿真验证了强化学习自动驾驶仪的性能,仿真结果表明,该算法具有良好的动态和稳态性能。
其他文献
该研究采用文献资料法、数理统计法和逻辑分析法等研究方法,研究参加比赛的国家队选手和一般参赛选手的技战术应用情况,研究结果发现我国参赛选手普遍较慢,一旦没有一发,该分
采用免疫组化法检测75例肾细胞癌(RCC)、12例正常肾组织中的基质金属蛋白酶.2(MMP-2)与血管内皮生长因子(VEGF)表达情况,计数微血管密度(MVD)。结果与正常肾组织比较,RCC组MMP-2、VEGF表
什么样的校长最受高中生欢迎?华东师范大学公共管理学院一项调查显示,既平易近人又不缺威严的“以柔克刚”型校长最受期待。此项调查选取上海交通大学、同济大学和华东师大来自
摘 要:游泳运动员选材是游泳系统训练中的第一步,也是最重要的组成部分之一。如何科学合理的选拔基层游泳运动员,是当前游泳运动项目发展的首要问题。为此,我们对如何科学设定身体形态指标与专项素质指标进行了分析,并就运动员初级选材中应注意的其他问题进行了探讨。  关键词:游泳 运动员 选材  中图分类号:G861 文献标识码:A 文章编号:2095-2813(2017)03(b)-0231-02  随着近
一、 问题的提出    新课标下,现行牛津英语教材语言丰富,结构复杂,特别体现在阅读部分。可目前初中英语教学普遍存在以下一些问题:  1. 许多教师在教学思想上,没有认识到阅读作为语言技能的一部分,因而对它的研究不够重视。  2. 讲解老师在阅读教学中,有的把阅读当精读;教学过程就是讲解生词、补充词组、罗列搭配、逐句逐段分析句子结构、语法等。  3. 教师没有形成一套科学有效、易操作,体现新英语课
为了实现对空情目标威胁评估准确、方便、快捷的需求,根据贝叶斯网络特点,运用联结树推理算法,将其应用在空情目标威胁评估系统当中。最后通过实例分析,综合敌方的破坏力、机动能
2005年1月~2006年2月,我院采用半导体激光治疗仪(PLDD)治疗腰椎间盘源性疼痛33例。现报告如下。
肾母细胞瘤(又称Wilm,s瘤)是小儿常见的肾脏肿瘤,成人罕见。1990年以来,我们共收治成人肾母细胞瘤患者5例。现报告如下。