不完美信息扩展式博弈中在线虚拟遗憾最小化

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户：yxh0710

【摘要】

：

研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种

【作者】

：

胡裕靖高阳安波

【机构】

：

软件新技术国家重点实验室（南京大学）,中国科学院计算技术研究所智能信息处理重点实验室

【出处】

：

计算机研究与发展

【发表日期】

：

2014年10期

【关键词】

：

扩展式博弈不完美信息遗憾最小化虚拟遗憾最小化静态估计法动态估计法

【基金项目】

：

国家自然科学基金项目(61035003,61175042,61321491,61202212);江苏省自然科学基金重点项目(BK2011005);江苏省普通高校研究生科研创新计划基金项目(CXLX13_049)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段：静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基

其他文献

园艺植物害虫的生物防治研究

在城市生态系统中，园林植物是非常关键的组成部分，而在园林植物养护中，园林害虫常常对园林植物造成了危害，对其防治研究具有较大的现实意义。园林植物害虫的种类繁多，在对其防治的

期刊

园艺植物生物防治研究

园艺植物害虫生物防治研究

园艺植物在生长、储藏加工期间非常容易受到害虫的危害.本文从生物防治的角度对园艺植物的害虫防治进行相关研究和分析,希望能提供一些参考作用.

期刊

园艺植物害虫生物防治

论英语学习与英文思维

期刊

从抽象到具体学习英语扩大词汇量

聚焦我省房地产未来发展方向

2015年10月,以沈阳建筑大学商学院院长刘亚臣教授为带头人的课题组承担了辽宁省社科联重点课题《关于我省房地产未来发展方向问题研究》。经过多次讨论和论证,课题组确定主要

期刊

房地产未来发展方向三类调查

麦冬花化学成分研究

目的:对麦冬花进行化学成分研究。方法:采用硅胶、聚酰胺和Sephadex LH-20柱层析进行分离纯化,根据理化性质和光谱分析鉴定化合物结构。结果:从麦冬花中分离得到了11个化合物

期刊

麦冬花化学成分

MSCT联合GM试验对肺曲霉菌病的诊断价值

目的探讨MSCT联合半乳甘露聚糖含量检测(GM试验)对肺曲霉菌病的诊断价值。方法疑诊131例肺曲霉菌病患者,91例被病理学或痰培养确诊为肺曲霉菌病。回顾性分析其MSCT征象、GM试

期刊

GM试验肺曲霉菌病体层摄影术X线计算机

端侧吻合修复周围神经缺损的研究进展

周围神经端侧吻合是周围神经损伤修复方法之一，它不同于经典的神经端端吻合，而是将损伤神经的远侧断端缝合到相邻健康的神经干侧壁上，或取一神经段以端侧吻合的方式桥接于损伤神

期刊

端侧吻合神经纤维神经干神经再生吻合神经小间隙桥接法周围神经缺损

罪己诏文体特点探微

罪己诏是我国古代一种特殊的文体。与其他诏书相比，它在行文语气、下诏内容和接受者方面都有所不同。这些不同之处又反映了“君与民”“君与德”“君与天”三对特殊的关系。

期刊

罪己诏皇帝德上天

我国环境空气质量标准与国外标准的比较

本文比较了国内外环境空气质量标准的浓度限值。指出我国环境空气质量标准分级更为细致;二氧化硫、可吸入颗粒物、二氧化氮、臭氧等污染物的二级标准浓度限值较为宽松;有毒污

期刊

环境空气质量标准浓度限值

子宫肌瘤介入治疗的围术期护理

[目的]探讨子宫肌瘤介入治疗围术期护理措施。[方法]回顾性分析13例子宫肌瘤病人行介入治疗的临床资料。[结果]通过对13例子宫肌瘤病人加强围术期护理,消除了病人恐惧心理,降

期刊

子宫肌瘤介入治疗围术期护理

不完美信息扩展式博弈中在线虚拟遗憾最小化

其他学术论文