论文部分内容阅读
现实世界的一些生产加工企业中,存在一类由生产加工站作为加工主体的生产线,称为传送带给料生产加工站(CSPS)。论文研究CSPS系统的最优控制问题,其优化目标是通过合理选择站点的前视(look-ahead)控制策略,实现系统的长远期望代价达到最优。理论上,该优化问题可通过数值方法求解,但是该方法存在“建模难”的问题。基于性能势的在线策略迭代(OPI)算法能够克服该问题,然而学习过程中采用查表法,缺少信息泛化能力,且CSPS系统中行动空间是连续的,离散化时离散粒度将影响系统的优化性能。因此,论文应用小脑