折扣准则相关论文
本文分别针对离散时间折扣准则MOMDP模型、离散时间平均准则MOMDP以及连续时间折扣准则MOMDP模型的摄动问题给予讨论,并分为两......
本文研究的是具有可数状态空间、紧的行动空间、有界转移率函数及上半连续报酬率函数的多约束条件马尔可夫决策过程。目的是解......
研究了仓库容量可以控制的、基于折扣准则的多周期随机存贮模型.利用马氏决策过程(MDP)的方法,建立了最小折现成本所满足的最优方程,在......