非时齐部分可观察Markov决策规划的最优策略问题

来源 :运筹学学报 | 被引量 : 0次 | 上传用户:linlijun002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文讨论了一类非时齐部分可观察Markov决策模型.在不改变状态空间可列性的条件下,把该模型转化为[5]中的一般化折扣模型,从而解决了其最优策略问题,并且得到了该模型的有限阶段逼近算法,其中该算法涉及的状态是可列的.
其他文献
本文研究一个投资问题中的信息价值,其中信息可以是不完美的,信息价值依赖于其结构.信息结构由状态变量与信息变量联合概率(或条件概率)矩阵来描述.我们定义了矩阵的一些偏序
目的观察自拟益肺补气汤治疗老年性慢性支气管炎迁延期的临床疗效。方法选择2013年12月-2015年6月本院收治的老年性慢性支气管炎患者90例,将其随机分为观察组和对照组各45例。
本文提出了一类新的带整数交易手数和凹型交易费用的均值绝对偏差模型(MAD)和极大极小投资组合模型(Minmax),并给出了离散模型的分枝定界算法.我们分别用随机产生的数据和Nasdaq股
《幼幼集成》是清代名医陈复正总结前人经验,并结合自己见解所编著的一部中医儿科代表作。陈氏为求辟妄救弊,取诸家之长,去粗取精,概为删订,附经验之方并多种外治法于其后。其中,陈
辽宁是人参的发源地,也是人参种植与开发最早的地区。明清时期,辽宁地区野山参资源丰富,采参行业从初期的自然采挖到有组织采挖逐渐发展到皇室垄断,全民采挖人参。清初,清太
6月13日上午,骄阳似火。副省长邵桂芳风尘仆仆地来到胶州市胶西镇小行村麦收现场。 没喝茶,没讲话,邵副省长径自走进麦浪滚滚的田野,对正在作业的联合收获机手刘琨亮和刘志栋
近年来,由于计算机应用的普及,以及互联网的广泛应用,全球计算机病毒呈爆炸性增长,导致了多次病毒爆发,这也反映出目前计算机系统和网络应用中的问题,计算机病毒已经成为全球性的安全问题。 亚洲地区,特别是中国内地,由于计算机普及较快,人们的安全意识相对不够高,因此对计算机病毒的防范相对薄
贵州省警方一举打掉了台湾、澳门的赌博公司在贵州开设的2个足球赌博网络。摧毁网络赌博平台4个,9名犯罪嫌疑人被刑事拘留。根据公安部和国家体育总局关于打击足球赌博的统一
土木建筑工程里有规定,达到一定规模的工程必须要有工程监理,在信息系统工程建设中也是如此,信息产业部发布的《信息系统工程监理暂行规定》,标志着我国的信息安全工程建设正在走向成熟。关于建设监理制度 保障信息系统工程签约双方的利益是保证我国计算机信息产业和信息系统工程顺利发展的重要方面。为了确保国家信息产业更加健康、有序地发展,为了使