基于半随机抽样非完备信息多人机器博弈

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：jiachengpu

【摘要】

：

机器博弈是人工智能领域公认的极具挑战性的科研方向之一，它的研究为人工智能带来了很多重要的方法和理论，产生了广泛的社会和学术影响。迄今为止，机器博弈已经在二人完备信息方

【作者】

：

徐红亮

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2006年期

【关键词】

：

半随机抽样非完备信息多人机器博弈启发式搜索方法蒙特卡罗抽样技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器博弈是人工智能领域公认的极具挑战性的科研方向之一，它的研究为人工智能带来了很多重要的方法和理论，产生了广泛的社会和学术影响。迄今为止，机器博弈已经在二人完备信息方向取得了成功，但在多人参与的、非确定性的、非完备信息博弈方面仍然存在许多问题。对于非完备信息博弈，学术界公认蒙特卡罗抽样是一种行之有效的启发式搜索方法，在桥牌等一些游戏上的应用已经取得了成功。但蒙特卡罗方法在理论上存在重要的缺陷。　　本文在全面分析了国内外蒙特卡罗抽样技术的应用现状与技术前景，针对蒙特卡罗抽样技术存在的缺陷，结合划分搜索（PartitionSearch）的方法，给出了一种基于半随机抽样启发式机器博弈算法。本文的主要研究工作如下：　　1.给出了一种基于半随机抽样启发式机器博弈算法。蒙特卡罗抽样技术存在策略融合（strategyfusion）和非本地化（non-locality）信息问题，本文结合划分搜索的方法，通过关注局面中的少数位置而忽略其他位置，融入策略规则控制，实现了对蒙特卡罗抽样技术的改进。　　2.将多智能体技术引入到机器博弈的研究中，给出了一种基于多智能体非完备信息多人博弈结构。采用集中式多智能体组织结构，博弈中的参与人是一个独立的主体智能体，博弈的非完备信息特点表现为每一个主体智能体只拥有自己的完备信息、对其他智能体的猜测信息和环境信息。　　3.设计并实现了一个四国军旗机器博弈系统。通过分析多盘四国军旗经典对局，结合四国军旗理论中的基本手筋，设计了3大类7条形式化通用规则，并用消解法论证推理的正确性，实现玩家策略规则控制；统计112个军旗常用布局，产生初始棋子概率表，并在博弈中对其进行维护，从而使半随机抽样选取更具代表性的走步。

其他文献

词间语义关系的研究及其在文本分类中的应用

自动文本分类是信息检索领域的基本任务之一。随着互联网上的信息量呈爆炸性增长,人们很难从大量的文本信息中迅速有效地提取出所需信息。为了解决信息迷向的现象,对文本分类

学位

文本分类语义关系向量空间模型依存模型句法分析

基于质心漂移聚类算法的LBS隐私保护研究

近年来，随着移动互联网的高速发展，LBS（基于位置服务）在人们日常生活中变得越来越重要，LBS在为人们带来高质量服务的同时，还存在着安全隐患。为了使LBS能持续健康发展，LBS的隐私保护

学位

LBS隐私保护K-匿名质心漂移自适应

基于分类语义的Web信息检索系统

随着WWW上信息资源数量成几何级数的增多，如何在海量数据空间中快速、准确的获取用户所需Web信息成为研究的焦点。本文设计并实现了一个基于分类语义的检索系统——SECS，该系统

学位

Web信息检索分类语义Web信息抽取网络蜘蛛层次化展示

扩展NS2支持移动Agent系统仿真

移动Agent技术是为解决复杂、动态、分布式的智能应用而提出的一种全新计算手段,它给分布式系统的设计、实现和维护都带来了新的活力,它有着许多传统分布式计算模型无法比拟

学位

移动Agent系统仿真平台NS2扩展性能分析

基于Delaunay三角化的点云表示的带状图像骨架化算法研究

基于点云数据的形状重建是当前计算机图形学领域研究的热点。针对采样于线状图形的离散点云数据的形状重建是其中的重要研究内容之一。采样于线状图形的离散点云数据也是常见

学位

Delaunay三角化骨架化带状图像

基于J2ME的移动支付安全方案研究

安全方案对移动支付系统的安全起着决定性作用，特别是无线环境中的安全和对用户即手持设备的认证，是系统成败的关键。目前移动支付几乎都是基于SMS、WAP的小面额的支付(即

学位

移动支付安全方案密码体制J2ME平台

智能防火墙过滤规则学习与优化

随着计算机网络的迅猛发展,网络的安全问题也越来越引起人们的重视。防火墙作为一种有效的安全防护措施被广泛应用于各种类型的网络当中。但是传统的防火墙是根据一些事先规

学位

网络安全智能防火墙专家系统规则优化

基于权重的Ad Hoc网络分簇算法的研究和改进

移动Ad Hoc网络(MANET)由移动的无线节点组成,广泛的应用在灾难恢复,战争,突发事件等场合。由于MANET没有固定的拓扑结构和网络主干,网络中的各个节点都要同时充当主机和路由

学位

Ad Hoc网络分簇算法统治集负载平衡

应用层VPN研究与实现

应用层VPN作为一种新兴的VPN解决方案,已经逐渐成为实现远程安全访问的最佳方式,也为网络到网络的VPN实现提供了新的解决途径。本文以应用层VPN为研究对象,首先介绍了SSL协议

学位

虚拟专用网SSLPKI安全网关

基于J2EE和Hibernate构建个性化网络信息检索系统

本文以“上海-巴符州科技经济信息通道”项目为依托，分析、设计和实现了基于黎曼空间模型的个性化网络信息检索系统。系统实现了自动识别用户兴趣、自动生成用户模型，生成检索

学位

J2EEHibernate网络信息检索个性化元搜索引擎黎曼空间模型

基于半随机抽样非完备信息多人机器博弈

与本文相关的学术论文