基于连珠模式的六子棋机器博弈关键技术研究

被引量 : 11次 | 上传用户：UltraSparc

【摘要】

：

机器博弈是人工智能学科的一个重要课题,是人工智能的“果蝇”,是检验利用智能方法解决复杂问题效果的试金石,其研究内容与人工智能和人类智慧都具有紧密的相关性。早在上世

【作者】

：

徐长明

【发表日期】

：

2010年01期

【关键词】

：

机器博弈六子棋 CPBIM 博弈树搜索估值函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器博弈是人工智能学科的一个重要课题,是人工智能的“果蝇”,是检验利用智能方法解决复杂问题效果的试金石,其研究内容与人工智能和人类智慧都具有紧密的相关性。早在上世纪60年代,Semual采用自学习方法编写的西洋跳棋程序就战胜了人类高手,一度引发了空前的轰动。在2005年,吴毅成教授首先提出了六子棋,其难度远远超过五子棋。由于Go-Moku和Renju这两种常见的五子棋博弈问题已经被成功地破解,六子棋便成为k子棋机器博弈研究中的新的挑战性问题。必须指出,已有的五子棋和六子棋机器博弈研究对相应棋类的复杂度均有着不同程度的高估,这反映了k子棋机器博弈的相关研究存在着重大的缺陷。以六子棋的机器博弈问题为对象,针对其研究现状,本文提出了基于连珠模式的六子棋机器博弈模型——CPBIM,旨在纠正现存研究成果之中的误区,进而提高k子棋机器博弈的研究水平。在CPBIM的基础上,围绕着机器博弈的关键性技术,对包括数据和知识的表示、搜索算法、估值方法、着法生成和排序等各个方面,分别展开了深入的研究。本文的创新性研究成果主要包括：(1)提出了一种基于“连珠”模式的六子棋机器博弈模型—CPBIM (Connection-Pattern Based Incremental Model),并将该模型推广到一族k子棋中。首先,提出了一种不同于传统模式的新模式——连珠,从而在局面的表示及分析方面,直接改善了程序的效率。接着,为了让连珠更好地表达领域的高级知识,提出了从低级的具体知识自动地推导出高级的抽象知识的方法,得到了一个严格且完善的连珠分类体系。然后,为了有效地解决k子棋博弈复杂度被严重高估的问题,提出了一种交叉点类型体系,从而保证程序有能力从众多候选点中过滤掉那些对博弈结果毫无影响的候选着法,还为实现高效的着法排序提供了关键性的支持。最后,为了加强博弈程序对高级知识的利用和提高程序的执行效率,结合连珠的非负整数表示法,提出了基于连珠来构建知识库的方法。(2)将迭代加深(Iterative Deepening)思想应用于威胁空间搜索(Threat SpaceSearch)中,提出了DFID-TSS (Depth First Iterative Deepening Treat Space Search)搜索。新的搜索算法找到的解的路径总是最短的；在求解能力不变的条件下,新算法的平均执行时间也大为缩短。(3)为利用CPBIM所提供的领域知识来改进搜索效率,在PN(Proof Number)搜索算法的基础上,提出了PN#搜索算法。PN#在PN总是倾向于搜索一棵稀疏的博弈树的基础上,还鼓励算法更优先地和更深入地搜索较好的分枝。PN#不但提高了搜索速度,降低了内存需求,而且在算法的实现上与PN同样简洁。(4)将神经元网络与TD(λ)算法相结合,引入到估值函数的设计当中,提出了一种以先验知识引导的估值函数自学习方法。该方法不仅避免了单纯采用自学习方法时出现的收敛速度慢等问题,还易于实现。此外,为降低无用样例对学习结果的负面影响,提出用有选择的可学习序列代替完整的棋谱作为学习样例。(5)针对连珠棋候选着法多、着法排序代价高的特点,提出了分类且逐步着法排序的方法,借此来降低着法排序的高昂代价。其中,对于同类着法的排序问题,还提出了新的排序机制,在不影响区分度的情况下,将评估值的取值范围尽可能地缩小,从而能够以高效的桶排序替代常用的选择排序。(6)在开局库设计、时间控制等方面,结合六子棋或机器博弈问题的特点,在充分考虑到性能与代价之间的平衡之后,均提出了相应的优化方法。上述模型、方法及算法均已被成功地运用于六子棋机器博弈软件NEUConn6之中。在国际和国内的一系列机器博弈竞赛当中,NEUConn6都取得了良好的成绩,从实践上有力地说明了本文研究工作的正确性、有效性和实用性。

其他文献

新的社会阶层人士“组织起来”的影响因素与有效途径

新的社会阶层人士是改革开放后产生、主要分布在体制外的新的社会群体,分散于不同地域、不同行业、不同岗位,具有规模庞大、组成复杂、利益诉求多元等特点,新的社会阶层人士

期刊

新的社会阶层人士组织起来统战工作有效途径

基于语料库的译者风格研究——以《背影》两个英译本为例

以朱自清名作《背影》的两个英译本为研究对象自建小型语料库,运用Ant Conc软件,从词汇和句法两个层面分别对杨宪益和张培基两个译本的翻译风格进行分析研究。经数据对比发现

期刊

语料库翻译研究译者风格《背影》词汇句法

高中信息技术教师发展现状的调查及对策的个案研究

一句“计算机的普及要从娃娃抓起”,就掀起了我国基础教育中计算机教育应用的改革与实践的发展潮流。至今,距离我国中小学正式普及开设信息技术必修课程,刚刚过了第十个年头

学位

信息技术课程信息技术教师信息技术教师发展高中

利用全固态激光技术及光学参量过程产生高功率连续单频激光的理论和实验研究

随着激光技术的飞速发展,各种激光光源已经广泛应用在我们生活中的各个领域,如工业领域中采用高功率的脉冲激光用于激光打标、激光焊接、材料切割和表面处理等；军事领域中用于

学位

全固态连续单频激光器内腔倍频绿光激光器内腔SRO外腔SRO1.5μm激光

“一带一路”之高铁外交——以泰国为例

<正>"丝绸之路经济带"和"21世纪海上丝绸之路"是在全球贸易格局不断变化形势下,中国连接世界的新型贸易之路。高铁外交作为"一带一路"的重要突破口,是更加紧密地连接中国与东

期刊

高铁外交中国与东南亚高速铁路“一带一路”

浅析汉代舞蹈形式与特征

汉代舞蹈博大兼容,题材多样,没有严格的舞蹈语言要求,这样的氛围,大大提高了艺术的创作空间,从而使汉代舞蹈形成了多姿多彩,不拘一格的艺术风貌。汉代舞蹈文化,对中国古典舞

期刊

汉代舞蹈长袖舞巾舞剑舞鼓舞

我国农村产业结构调整中的金融中介支持研究

20世纪90年代以来,以农业产业化滞后、农村经济发展缓慢、农民增收困难为核心的“三农”问题日益凸现,如何构建全面发展的小康社会成为各界关注的焦点。大量经济发展的事实显

学位

金融中介产业结构调整农业产业化金融支持

住宅小区规划设计中存在的问题及措施

小区规划是城市建设发展的重要的核心组成部分,小区规划的好坏不仅直接体现着城市发展建设的好坏,还直接影响到居民居住生活环境的好坏,因此,在小区的发展建设中,小区规划是

期刊

小区规划设计问题解决措施

服装质量预测系统的软件设计与实现

随着服装款式的增多和人们对于服装质量要求的提高,迫使服装企业对质量的预防和控制力度大幅提升,传统的人工管理缺乏效率且无法保证产品的质量。生产跟踪系统作为服装企业信

学位

粗糙集服装质量预测知识库专家系统

飞机噪声引起的暂时性听力变化

<正> 为了探索飞机噪声对飞行人员和机务人员听力影响的规律和特点,我们以歼-6飞机地面试车时的噪声作为噪声源,测定了20人（40耳）在发动机噪声作用前的听力及作用后的即时性听

期刊

暂时性飞机噪声

基于连珠模式的六子棋机器博弈关键技术研究

其他学术论文