基于半随机抽样非完备信息多人机器博弈

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jiachengpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器博弈是人工智能领域公认的极具挑战性的科研方向之一,它的研究为人工智能带来了很多重要的方法和理论,产生了广泛的社会和学术影响。迄今为止,机器博弈已经在二人完备信息方向取得了成功,但在多人参与的、非确定性的、非完备信息博弈方面仍然存在许多问题。对于非完备信息博弈,学术界公认蒙特卡罗抽样是一种行之有效的启发式搜索方法,在桥牌等一些游戏上的应用已经取得了成功。但蒙特卡罗方法在理论上存在重要的缺陷。  本文在全面分析了国内外蒙特卡罗抽样技术的应用现状与技术前景,针对蒙特卡罗抽样技术存在的缺陷,结合划分搜索(PartitionSearch)的方法,给出了一种基于半随机抽样启发式机器博弈算法。本文的主要研究工作如下:  1.给出了一种基于半随机抽样启发式机器博弈算法。蒙特卡罗抽样技术存在策略融合(strategyfusion)和非本地化(non-locality)信息问题,本文结合划分搜索的方法,通过关注局面中的少数位置而忽略其他位置,融入策略规则控制,实现了对蒙特卡罗抽样技术的改进。  2.将多智能体技术引入到机器博弈的研究中,给出了一种基于多智能体非完备信息多人博弈结构。采用集中式多智能体组织结构,博弈中的参与人是一个独立的主体智能体,博弈的非完备信息特点表现为每一个主体智能体只拥有自己的完备信息、对其他智能体的猜测信息和环境信息。  3.设计并实现了一个四国军旗机器博弈系统。通过分析多盘四国军旗经典对局,结合四国军旗理论中的基本手筋,设计了3大类7条形式化通用规则,并用消解法论证推理的正确性,实现玩家策略规则控制;统计112个军旗常用布局,产生初始棋子概率表,并在博弈中对其进行维护,从而使半随机抽样选取更具代表性的走步。
其他文献
自动文本分类是信息检索领域的基本任务之一。随着互联网上的信息量呈爆炸性增长,人们很难从大量的文本信息中迅速有效地提取出所需信息。为了解决信息迷向的现象,对文本分类
近年来,随着移动互联网的高速发展,LBS(基于位置服务)在人们日常生活中变得越来越重要,LBS在为人们带来高质量服务的同时,还存在着安全隐患。为了使LBS能持续健康发展,LBS的隐私保护
随着WWW上信息资源数量成几何级数的增多,如何在海量数据空间中快速、准确的获取用户所需Web信息成为研究的焦点。本文设计并实现了一个基于分类语义的检索系统——SECS,该系统
移动Agent技术是为解决复杂、动态、分布式的智能应用而提出的一种全新计算手段,它给分布式系统的设计、实现和维护都带来了新的活力,它有着许多传统分布式计算模型无法比拟
基于点云数据的形状重建是当前计算机图形学领域研究的热点。针对采样于线状图形的离散点云数据的形状重建是其中的重要研究内容之一。采样于线状图形的离散点云数据也是常见
安全方案对移动支付系统的安全起着决定性作用,特别是无线环境中的安全和对用户即手持设备的认证,是系统成败的关键。 目前移动支付几乎都是基于SMS、WAP的小面额的支付(即
随着计算机网络的迅猛发展,网络的安全问题也越来越引起人们的重视。防火墙作为一种有效的安全防护措施被广泛应用于各种类型的网络当中。但是传统的防火墙是根据一些事先规
移动Ad Hoc网络(MANET)由移动的无线节点组成,广泛的应用在灾难恢复,战争,突发事件等场合。由于MANET没有固定的拓扑结构和网络主干,网络中的各个节点都要同时充当主机和路由
应用层VPN作为一种新兴的VPN解决方案,已经逐渐成为实现远程安全访问的最佳方式,也为网络到网络的VPN实现提供了新的解决途径。本文以应用层VPN为研究对象,首先介绍了SSL协议
本文以“上海-巴符州科技经济信息通道”项目为依托,分析、设计和实现了基于黎曼空间模型的个性化网络信息检索系统。系统实现了自动识别用户兴趣、自动生成用户模型,生成检索