逻辑马尔可夫决策编程和关系马尔可夫决策编程若干最新进展

来源 :计算机科学 | 被引量 : 0次 | 上传用户:dfsdasdas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
逻辑马尔可夫决策过程和关系马尔可夫决策过程的引入,使得人们可能简洁地、陈述地表达复杂的马尔可夫决策过程。本文首先介绍有关逻辑马尔可夫决策过程和关系马尔可夫决策过程的概念,然后重点介绍它们与普通的马尔可夫决策过程根本不同的一些算法:①依赖于基本状态空间RL的转换法;②把Bellman方程推广到抽象状态空间的方法;③利用策略偏置空间寻求近似最优策略方法。最后对它们的研究现状进行总结及其对它们发展的一些展望。
其他文献
为了提高建设行业专业技术人员、管理人员科技创新能力,促进科技成果转化应用,建设部科技发展促进中心紧紧围绕建设部的中心工作,积极开展以新技术、新成果、新规范为重点的
期刊出版的持续性和特殊性表明,当服务质量随着出版物数量的增长而需求进一步提高时,不著录编目就无法满足需求,文章结合本馆的实际,论述了期刊分编的重要性。
本文介绍了语义Web在个人计算机方面的一种新应用——语义桌面技术。首先介绍语义桌面的产生和发展历程,然后给出语义桌面的定义和体系结构,并且介绍了语义桌面的各个组成部分