基于蒙特卡罗抽样的桥牌机器博弈的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haijiehahaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文属于人工智能范畴。人工智能是20世纪三大科技成就之一,机器博弈是人工智能研究的发源地和原动力。自1956年人工智能创立同年,塞缪尔研制成功了“跳棋机”电脑软件以来,研究者们已经发展了一系列的通用的卓有成效的完备信息搜索技术,使得在以国际象棋为代表的机器博弈比赛中,机器选手的水平已经达到或超越人类的顶尖选手。  桥牌作为一项高雅、文明、竞技性很强的体育运动风靡全球,并以它特有的魅力而称雄于各类牌戏。以计算机模拟进行的桥牌机器博弈是一种非完备信息博弈,它已被证明是一个NP难题,只能寻找近似的解决方法,其相关研究目前还不是十分成熟。  本文从讨论最简单的“二人零和、完备信息、非偶然”博弈入手,详细剖析了极大极小值算法,并以此为基础,引申探讨了其它完备信息的基本搜索算法。接着,通过蒙特卡罗抽样方法来消除游戏中的非完备信息问题,应用双明手算法来处理桥牌机器博弈。  我们借助成熟的商业软件Jack4.01随机产生一批牌局,并将其发牌、叫牌(使用简化的美国标准黄卡叫牌法)和打牌的全过程生成 html文件,再输入到本系统作为参照物。本系统以发牌和叫牌信息为已知信息,我们站在首攻人的角度去考虑出牌,出第一次牌之前,很显然他手上的13张牌中的任一张都是可供选择的,我们通过提取叫牌过程中产生的牌情约束条件,建立牌张概率分布表,应用蒙特卡罗方法产生一组牌,并对其进行双明手搜索,计算每一种走步的收益,在允许的时间内对上述流程进行多次重复,最终汇总计算出每一种走步的得分,然后与商业软件Jack4.01实际走步比对,以一个特定公式进行打分,验证蒙特卡罗方法的广泛适用性和桥牌机器博弈的可实现性。基于同样原理,每一轮由电脑按照读入信息完成其他三方的出牌,本系统站在原首攻人的角度来对局面进行一次分析,以完成桥牌全局机器博弈。  最后,以三个典型桥牌局面为例,分别记录其三组实验数据,验证了以蒙特卡罗抽样方法是可以用来解决桥牌机器博弈的。
其他文献
可视密码方案(VCS)是一种新的秘密共享机制,与传统的密码学相比,加密与解密的过程无需运用复杂的数学运算,而且参与者也无需密码学知识;实现不需要很高的技术,实现成本较低,只需一
不平衡学习问题是机器学习领域的难题之一,其困难主要是由于不平衡数据集本身的特点造成的。比如,某类样本数量严重不足,样本分布不能很好地反映实际分布。而目前现有的学习
移动AdH oc网络是不依赖于任何固定基础设施而通过移动节点间的相互协作来进行网络互联的移动网络。由于没有固定基站,缺乏足够的物理保护、动态的拓扑结构和开放的无线信道、
图像去噪和图像分解是图像处理领域中比较重要的两大课题。自上世纪八十年代以来,基于偏微分方程的图像处理方法逐渐成为研究的热点,并取得了迅速的发展。论文主要对基于偏微
手势识别是近些年来比较热门的一项人机交互技术,它属于机器学习范畴。作为一项对用户限制较小的人机交互技术,世界各地的研究人员们正在进行着将手势识别技术用于各个领域的研
Web2.0技术在过去几年的快速发展极大地改变了人们的生活模式,其中最为显著的改变之一就是购物模式的改变。随着电子商务的蓬勃发展以及各种Blog、BBS、虚拟社区等网络媒介的
随着Internet的发展,网络中的安全问题已经引起人们越来越多的重视。IPv6作为下一代Internet核心协议,逐渐代替IPv4已经成为必然趋势。但是在IPv4向IPv6过渡的过程中,不可避免地
纹理图像分割是图像处理领域里的一项具有挑战性的课题。因为纹理图像的灰度往往具有高震荡性、且图像的纹理很难给出统一的数学定义。为了有效地进行纹理图像分割,本文提出几
通过针织工艺辅助设计系统的编程来实现编织的各种组织和设计各种产品的款式。在花型结构设计时,每一种结构花型的编织的方法都是多样的,设计人员采用了针织工艺模块的设计,减少
无线网状网络也称为无线Mesh网络,是近几年出现的一种与传统无线网络完全不同的新型网络技术,因其拥有节点自组织、设备自配置、网络自修复、动态网络连接、易部署、基础设施成