基于棋牌类组合规则的游戏人工智能的设计与实现

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:luowencheng7758258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
游戏中智能的设计与构建一直是人工智能研究中的热门领域。游戏中,人工智能不仅要模仿人的智能,还需要拥有达到设计者为了满足玩家需求所设定的目的的能力。通过对游戏信息的收集、积累和归纳,智能体凭借获得的经验对游戏的状态有了一定的预见性,并由此做出合理的反应。   早期的人工智能运行在固定的环境下,作为一个成熟的人工智能,依靠设计者的知识和经验生存在对应的环境中。智能体在决策时获得所有的可操作行为以及对应产生的结果,由此依据当前的情况建立局部或全局决策树。常用的方法有最小最大算法、A*算法、有限状态机等。此类智能体的局限在于必须依靠设计者的经验以及不允许环境发生变化。换言之,设计者必须考虑所有可能的情况,否则当环境变化超出原有预先的设计时,智能体则无法做出正确的行为。   通用游戏策略旨在开发一种没有游戏经验支撑下能够精通各类游戏的人工智能。在仅获得游戏规则的情况下,依靠智能体的学习能力实现经验的累积过程。这对于人工智能的实现有非常大的意义。   本文的主要提出一种适合于通用游戏策略环境下人工智能的设计方法。采用时序差分学习算法解决了游戏经验积累的问题;通过对游戏过程中的状态进行筛选和抽象,提高智能体的决策效率。并实现了对棋类游戏 Tic-Tac-Toe中的人工智能设计。   其次,利用蒙特卡洛抽样方法实现棋牌类游戏中非完备信息向完备信息的转化,从而适用于通用游戏策略。并运用在融合了棋类与牌类规则的Card-TTT游戏中,使智能体在包含了非完备信息的环境中依然可以进行学习和游戏。由此证明了该方法的实际应用价值。   最后,将设计的人工智能参与四种不同的游戏。通过游戏的比赛结果,说明采用本文的设计方法不但能够降低人工智能设计者的要求,而且还能令智能体的游戏能力达到与人类玩家不相上下的程度。
其他文献
伴随着信息技术的网络化、数字化和自动化的进一步发展,大量的秘密信息之间不断进行着相互地传输与交流,因而对信息安全的要求也变得新益求新。信息安全是信息技术发展的保障
随着互联网在人们工作、生活中的日益渗透以及互联网海量信息的飞速膨胀,催生了互联网搜索业务的诞生以及搜索引擎技术的发展。然而,现存的传统搜索引擎虽然部分解决了人们的
敏感图像作为不良信息的一种,严重破坏了健康的网络环境。为此研究者们提出了多种敏感图像过滤技术,其中以基于内容分析的过滤方法最为流行。然而,基于内容的敏感图像过滤技
随着计算机及网络技术的普及,计算机和网络逐渐成为人们生活和生产不可或缺的一部分。计算机和网络在给人们带来极大便利的同时,也带来的了令人应接不暇的计算机安全问题,如
学位
纹理合成是以人工合成纹理为目的,是计算机图形图像处理领域的重要研究内容。基于样图的纹理合成是近年来出现的新技术,它以小块纹理图像作为输入合成任意大小的同类纹理图像
随着Internet的飞速发展,网络规模逐渐扩大,网络流量行为也越来越复杂,导致异常行为增多,所以有必要对这些网络行为进行监测和分析。因此,基于异常流量分析系统的数据采集、
无线传感器网络综合了传感器技术、嵌入式系统、Internet及无线通信、分布式信息处理技术等,在军事、环境监测、灾难救援及其他商业活动领域有着广阔的应用前景。无线传感器
随着计算机和网络技术的迅速发展,日趋严重的计算机犯罪给个人、企业、甚至社会的安定和稳定都造成了巨大的影响。计算机取证技术在这种背景中应运而生,并逐渐成为打击高科技犯
数据库系统和信息检索系统在处理数据的方法上有很大的差别,数据库系统通过复杂的查询语言搜索结构化数据,其结果集完整精确;信息检索系统通过关键字搜索非结构化数据,其结果集通