策略迭代算法相关论文
微网(micro-grid)由分布式发电装置、储能装置、负荷及控制装置组成,既可并网运行,也可以孤岛运行。在并网运行时,与电网进行能量......
现实的自动化生产线中,有一类由传送带将工件送至配有缓冲库的加工站进行加工的生产系统,称之为传送带给料加工站(Conveyor-Servic......
铁路货车运输能力的快速扩充和货车维修策略由计划修向状态修的转变为货车的维修管理带来了巨大挑战。车轮作为铁路货车的关键零部......
本文考虑连续时间Markov决策过程平均报酬的方差优化问题.假设状态空间是可数的,行动空间是Borel可测空间.本文的主要目的是在确定......
为了在采样不完全、个体差异明显的条件下对缓慢退化系统的维修策略进行研究,针对具有个体差异的缓慢退化系统,选择线性混合效应模......
为了解决非线性系统中的最优控制问题,在性能势理论的基础上,提出了一种基于勒贝格采样的新的事件触发控制策略。首先,根据最优控......
针对多状态半马尔可夫退化系统,研究了系统发生故障后的维修模型.在系统的退化过程中,有多个不可逆的工作状态和故障状态.系统的所......
针对二自由度飞行姿态模拟器的姿态稳定问题,依据强化学习中的策略迭代算法设计姿态稳定控制器。将策略迭代学习算法与多项式T-S模......