论文部分内容阅读
机器博弈是人工智能领域公认的极具挑战性的科研方向之一,它的研究为人工智能带来了很多重要的方法和理论,产生了广泛的社会和学术影响。迄今为止,机器博弈已经在二人完备信息方向取得了成功,但在多人参与的、非确定性的、非完备信息博弈方面仍然存在许多问题。对于非完备信息博弈,学术界公认蒙特卡罗抽样是一种行之有效的启发式搜索方法,在桥牌等一些游戏上的应用已经取得了成功。但蒙特卡罗方法在理论上存在重要的缺陷。 本文在全面分析了国内外蒙特卡罗抽样技术的应用现状与技术前景,针对蒙特卡罗抽样技术存在的缺陷,结合划分搜索(PartitionSearch)的方法,给出了一种基于半随机抽样启发式机器博弈算法。本文的主要研究工作如下: 1.给出了一种基于半随机抽样启发式机器博弈算法。蒙特卡罗抽样技术存在策略融合(strategyfusion)和非本地化(non-locality)信息问题,本文结合划分搜索的方法,通过关注局面中的少数位置而忽略其他位置,融入策略规则控制,实现了对蒙特卡罗抽样技术的改进。 2.将多智能体技术引入到机器博弈的研究中,给出了一种基于多智能体非完备信息多人博弈结构。采用集中式多智能体组织结构,博弈中的参与人是一个独立的主体智能体,博弈的非完备信息特点表现为每一个主体智能体只拥有自己的完备信息、对其他智能体的猜测信息和环境信息。 3.设计并实现了一个四国军旗机器博弈系统。通过分析多盘四国军旗经典对局,结合四国军旗理论中的基本手筋,设计了3大类7条形式化通用规则,并用消解法论证推理的正确性,实现玩家策略规则控制;统计112个军旗常用布局,产生初始棋子概率表,并在博弈中对其进行维护,从而使半随机抽样选取更具代表性的走步。