基于KL距离的交互式动态影响图近似算法

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:21stsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model updates,DMU)相结合的近似算法。首先给出了基于Kullback—Leibler(KL)距离模型行为等价和近似行为等价的定义,然后基于KL距离和候选模型的动作对候选模型聚类,自上而下合并策略树形成策略图,最后利用DMu算
其他文献
随着时代的发展,互联网+已经成为当下时代的主流,而互联网技术也已经运用到了我国教育教学当中,并且在我国教育教学中发挥出了巨大的作用。中小学作为我国教育体系的正式开端
等离子喷涂在石油化工和现代化工业领域具有广泛的应用背景。目前国内关于超音速等离子喷涂的模拟计算工作还较少,现有的计算多集中在低压环境下,数值模拟大多基于局域热力学
三元复合驱是一项可大幅度提高原油采收率的三次采油技术,其体系由聚合物、碱、表面活性剂三相组成,驱油机理相对复杂,影响因素也相对较多。为此,通过开展物理模拟驱油实验,
随着社会的发展和科学技术的进步,信息技术得到了飞速发展,并广泛应用于各个行业之中。信息技术在教育教学的应用,不仅改变了教育教学的方法和形式,也使得教学效率和质量得到
我们采用放射免疫分析法(RIA)检测了74例不同病因的胸水病人血浆和胸水中心钠素(ANP)含量,旨在探讨其对良恶性胸水的鉴别诊断价值.对象和方法一、对象:(一)肺结核胸水组41例(
对一类多变量非线性系统提出了直接自适应模糊预测控制方法,此方法首先对被控对象提出了线性时变子模型加非线性子模型的预测模型,然后直接利用模糊系统设计预测控制器,并基
特征加权是聚类算法中的常用方法,决定权值对产生一个有效划分非常关键。基于模糊集、粗糙集和阴影集的粒计算框架,本文提出计算不同簇特征权重的聚类新方法,特征权值随着每次迭
知识是思维的载体,思维又从惊奇和问题开始。这里的问题可以是一般的数学问题,也可以是通过师生营造一种能唤醒和激发学生探索精神和创造欲望的问题背景和思维环境,让学生的
一、舞台服装与时装的关系   舞台服装主要用于舞台表演,它与时装不同,它们所属的范畴与存在的目的是完全不一样的.时装是为了满足人们物质生活的需要,是以功用为第一目的,