观察过程状态数为可数的POMDP的算法

来源 :湖南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:djkangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
给出了观察过程状态数为可数时,部分可观的马尔可夫决策规划(POMDP)折扣模型的逼近法和算法,算法保证了能求到ε-最优的平稳策略和ε-最优的期望费用函数。
其他文献
通过矩阵SP·n和ISP·n的三角分解,得到了线性方程组在SP·n(ISP·n)中的反问题的解。
介绍一种分析a-Si掺杂效率的新方法。该法能够很好地解决a-Si全掺杂范围内掺杂浓度和掺杂效率的计算问题,简便易行,为a-Si掺杂性能研究和器件设计制造提供可靠的掺杂浓度和掺杂效率值。
给出了图形变形和图像变形的定义,研究了图形变形和图像变形的基本原理,探讨了开发三维动画软件过程中实现变形的基本方法.
结合“八·五”期间国家环保示范工程长沙市第二污水净化中心应用氧化沟工艺处理城市污水的实际运行情况,论述了氧化沟在处理低浓度污水,选择高负荷工艺参数,具有总投资省、
利用化学镀的方法制备了非晶态Fe-Mo-W-B四元合金镀层,利用X射线衍射方法屯镀层的结构,样品的磁损耗的由交流互感电桥原理测量,结果表明:具有较宽形成玻璃体能力的成分区域同时具有较低的磁
采用恒电位方法研究了羟基乙叉二膦酸(HEDP)、二乙烯三胺五甲太膦酸(DETPMP)、三乙烯四胺六甲叉膦酸(TETHMP)、乙二胺四叉膦酸(EDTMP)对碳钢在NaHCO3-Na2CO3缓冲液中钝化过程破裂电位的影响,结果表明;在一定的浓度范围内,上
研究了铍-二溴羟基苯基荧光酮-Brij-35胶束显色反应的最佳形成条件,在pH8.3-9.5的弱碱性介质中,配合物最大吸收波长是548nm,其表观摩尔吸光系数是1.42×10^5L.mol^-1,cm^-1,铍量在0-1.6μgBe/25mL范围内遵守比尔定律。
研究以丙酮为原料,经亲核加成反应,Bucherer-Berg‘s环化反应和羟甲基化等三步反应合成,1,3-二羟甲基-5,5-二甲基乙内酰脲的工艺路线,总收率68^%-78%。产物经^1HNMR,^13CNMR谱和元素分析鉴定。
运用文献资料法、访谈法、问卷调查法、数理统计法,对武汉地区7所大学的部分教师参与健身运动状况进行调查分析,旨在表明教师的健康状况不佳的主要原因,并提出改善教师健身现
运用最大熵技术对湖南汽车工业部分重点企业进行了优序分析,并以此为基础,探讨了湖南汽车工业应优先发展的产品,针对性地提出了加快发展湖南汽车工业的若干建议。