基于Q—学习的非线性控制

来源 :长沙电力学院学报(自然科学版) | 被引量 : 0次 | 上传用户:xzm191213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
给出了一种新的激励学习(RL)方法,它能够有效地解决一个状态与动作空间为连续的非线性控制问题.在实际的应用中,离散的RL方法能把许多非线性控制问题分解成几个局部线性控制作业.提供了一种由简单的线性控制器和Q-学习构成的层次性RL算法.连续状态-动作空间被形象地分成为一些格子,并且每个格子都有它自己的局部线性控制器.状态空间的隔离是处理维数问题的一种相当简单的方法,但是经常会引起非Markov效果,而局部线性控制器能弥补这个缺陷.
其他文献
为解决现行固定床稀土氟化炉内因温度分布不均而导致的氟化效果不佳问题,以新型立式氟化炉为研究对象,通过合理简化建立数学物理模型,采用CFD软件对模型进行计算分析,得到了
主持人:于先生和邹先生结缘,编辑出版了邹先生所著的<听老子讲道>、<伴孔子周游>、<〈道德经〉旁说>等文化系列,这个系列的选题是基于什么而策划的呢?
讨论网络计费系统的原理,比较了基于TELNET的计费方式和基于SNMP的计费方式的不同;论述了SNMP协议在网络计费系统中的实现.在此基础上设计了一个具体的计费系统模型,该计费系
XPDL是工作流管理联盟推出的需由开发商共同遵守的一个统一的过程定义语言规范,由它定义的接口能在开发和运行环境之间提供形式上的分离.此外,用建模工具产生的过程定义可以
本文通过对凤翔县小型水库养鱼在鱼种投放、水质调节、鱼病防治、施肥等日常管理及经营方面的实践总结,就进一步提高小型水库鱼产量,取得更好的经济效益,提出了可行性的意见和对
在中国图书出版由品种数量向质量效益的转变过程中,精品生产始终具有重要的示范和带动作用.经中宣部研究批准,确定精神文明建设“五个一工程”一本好书、国家图书奖和中国图