动态影响图模型研究

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:zguohui69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分可观察马尔可夫决策过程在策略空间和状态空间上的计算复杂性,使求解其一个最优策略成为NP-hard难题.为此,提出一种动态影响图模型来建模不确定环境下的Agent动态决策问题.动态影响图模型以有向无环图表示系统变量之间的复杂关系.首先,动态影响图利用动态贝叶斯网络表示转移模型和观察模型以简化系统的状态空间;其次,效用函数以效用结点的形式清晰地表示出来,从而简化系统效用函数的表示;最后,通过决策结点表示系统的行为来简化系统的策略空间.通过实例从3个方面和POMDP模型进行了比较,研究的结果表明,动态影响图
其他文献
九龙脑岩体为燕山早期形成,岩性为重熔"S"型花岗岩,石英含量较高,钾长石大于斜长石,暗色矿物以黑云母为主,副矿物中常有磁铁矿、锆石、磷灰石、独居石、萤石、黑钨矿等,多阶段
Differences in illumination of the same face can defeat simple face recognition systems,yet most methods that compensate are too difficult to implement. Local q
期刊
榆林坪银铅矿为豫西南地区较典型的银铅矿床,论述了该矿床的地质特征、矿石特征、银赋存状态、围岩蚀变、矿化阶段及矿物生成顺序,总结其成矿规律,并探讨了矿床成因。与同内矿床
目的分析首发及复发精神分裂症住院患者生活质量及影响因素。方法通过方便抽样法选取2017年11月至2018年1月山西省首发及复发精神分裂症患者各50例,采用问卷调查的方法进行调
传统的隐马尔科夫模型(HMM)的训练方法基于统计概率的最大似然准则(MLE),在训练样本数目足够大的情况下,这种方法在理论上可以得到最优的结果.在手语识别研究中,采集足够大的训练样本十分困难.区分性训练可以很好地弥补由于训练样本的缺乏以及手语模型之间的近似而造成的识别系统的缺陷.最大交互信息准则(MMIE)作为区分性训练准则的一种已经被广泛的应用于语音识别领域.文中通过合理的构建手语识别中的竞争模
在我国,除了国防军事应用的作战指挥专网外,无线专网的行业应用需求主要集中在政务网和企业网两大类。政务网是面向公共安全和政务指挥调度的专网,行业用户包括:警察、安全、
目的分析综合护理模式对开放性胫腓骨骨折疼痛、心理及并发症的影响。方法选取医院2017年6月至2019年6月收治的开放性胫腓骨骨折患者98例,按入院顺序奇偶性分组,分为对照组(
挤扩支盘灌注桩作为一种新型深基础,在适宜土层条件下可取代目前工程上使用最多的预制桩、钻孔灌注桩以及大直径桩墩基础。不仅可以作为承载桩,也可作为支盘桩、抗拔桩和承受较
瓦斯做为一种地质体,其形成和保存、运移、富集及释放,同地质因素密切联系并受其制约,制约煤与瓦斯突出的主要因素有:含煤岩系的沉积环境、围岩特征及其组合、煤层厚度及其变化、