半Markov决策过程折扣模型与平均模型之间的关系

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:rfvbgtyhnmju
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先分别在折扣代价与平均代价性能准则下,讨论了一类半Markov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后讨论了两种模型之间的关系,表明了平均模型的有关结论,可以通过对折扣模型相应结论取折扣因子趋于零时的极限来得到.
其他文献
目的分析乙肝高效免疫球蛋白、卡介苗同时注射对新生儿接种卡介苗效果影响。方法选取2015年2月~2017年2月某疾病控制中心收治的孕产妇及新生儿60例作为研究对象,将其分为两组
<正>Conference Theme Advanced Technologies for Emergency Planning and ResponseThe 2008 IEEE International Conference on Networking, Sensing and Control will be
期刊
针对一类状态不可测的非线性不确定分布式时滞系统,给出了系统滑动模态鲁棒渐近稳定的充分条件。设计了一类滑模观测器,同时采用线性矩阵不等式的处理方法给出了该观测器存在的
目的观察并分析优质护理对家长满意度和小儿静脉输液穿刺成功率的影响成效。方法选取2016年9月~2017年9月本院收治的52例静脉输液患儿为研究对象,将其随机分为观察组与对照组
目的对小儿哮喘患儿在雾化吸入治疗中给予优质护理,针对其肺功能及治疗依从性的改善情况加以分析。方法本次研究选取2016年3月~2017年9月本院收治的患儿80例,参照随机抽选方
目的探究临床护理模式在PFNA(防旋转股骨近端内钉)微创治疗股骨粗隆周围骨折的干预效果。方法选取2015年02月~2017年02月在我院进行PFNA微创治疗的股骨粗隆周围骨折患者72例
目的分析研究对老年结肠癌患者的围手术期护理中应用快速康复外科理念的临床效果并对其进行评价。方法选取2016年6月~2017年6月我院被确诊为结肠癌的老年患者60例作为研究对
目的针对肝癌患者接受介入栓塞术之后发生并发症行以循证护理,并结合护理结果对其临床应用价值予以分析。方法选取2015年3月~2016年4月我院收治的肝癌患者80例作为研究对象,
<正>Networked sensing and control has attracted significant interest in recent years due to its wide applications. For