【摘 要】
:
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控
【基金项目】
:
民航飞机健康监测与智能维护重点实验室基金项目(NJ2018012),先进飞行器导航、控制与健康管理工业和信息化部重点实验室(南京航空航天大学)项目,中央高校基本科研业务费项目(NS2017017),国家自然科学基金项目(61533008,61490703)资助
论文部分内容阅读
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了
其他文献
目的探讨中医针灸推拿护理在颈椎病患者的护理中的临床效果。方法选取2017年6月—2018年6月于本院治疗的100例颈椎病患者作为研究对象,按照随机数字表法分为研究组和对照组两
创新创业教育成为当下绝大多数高校素质教育的趋势,而实践类课程改革是实施创新创业教育的重要内容。金工实习是多数高校在工科专业中所开设的一门必修课程,旨在培养学生对机械
现代刑事诉讼制度发展的一个突出特点,就是在赋予诉讼当事人尤其是刑事被告人以充分的诉讼权利的基础上,以独立的私权对抗强大的公权体系,表现出对民主、科学、人权的理想诉讼模
为了解决现有植酸盐转化膜耐水洗性差的问题,利用植酸的反应活性及酸催化活性,使之与三乙醇胺进行酯化反应,将所得产物与促进剂、配位剂等进行复配,采用正交法优化转化液配比和转
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
随着社会对同时掌握商务与英语的商务英语专业学生的需求的加大,高校对商务英语专业的人才培养更加重视。为了更好地加强学生在商务领域运用英语的能力,产学研用合作对高校商