不完美信息扩展式博弈中在线虚拟遗憾最小化

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:yxh0710
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段:静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基
其他文献
在城市生态系统中,园林植物是非常关键的组成部分,而在园林植物养护中,园林害虫常常对园林植物造成了危害,对其防治研究具有较大的现实意义。园林植物害虫的种类繁多,在对其防治的
园艺植物在生长、储藏加工期间非常容易受到害虫的危害.本文从生物防治的角度对园艺植物的害虫防治进行相关研究和分析,希望能提供一些参考作用.
2015年10月,以沈阳建筑大学商学院院长刘亚臣教授为带头人的课题组承担了辽宁省社科联重点课题《关于我省房地产未来发展方向问题研究》。经过多次讨论和论证,课题组确定主要
目的:对麦冬花进行化学成分研究。方法:采用硅胶、聚酰胺和Sephadex LH-20柱层析进行分离纯化,根据理化性质和光谱分析鉴定化合物结构。结果:从麦冬花中分离得到了11个化合物
目的探讨MSCT联合半乳甘露聚糖含量检测(GM试验)对肺曲霉菌病的诊断价值。方法疑诊131例肺曲霉菌病患者,91例被病理学或痰培养确诊为肺曲霉菌病。回顾性分析其MSCT征象、GM试
周围神经端侧吻合是周围神经损伤修复方法之一,它不同于经典的神经端端吻合,而是将损伤神经的远侧断端缝合到相邻健康的神经干侧壁上,或取一神经段以端侧吻合的方式桥接于损伤神
罪己诏是我国古代一种特殊的文体。与其他诏书相比,它在行文语气、下诏内容和接受者方面都有所不同。这些不同之处又反映了“君与民”“君与德”“君与天”三对特殊的关系。
本文比较了国内外环境空气质量标准的浓度限值。指出我国环境空气质量标准分级更为细致;二氧化硫、可吸入颗粒物、二氧化氮、臭氧等污染物的二级标准浓度限值较为宽松;有毒污
[目的]探讨子宫肌瘤介入治疗围术期护理措施。[方法]回顾性分析13例子宫肌瘤病人行介入治疗的临床资料。[结果]通过对13例子宫肌瘤病人加强围术期护理,消除了病人恐惧心理,降