基于知识与树搜索的非完备信息博弈决策的研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:dd398622409xiewenjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类生活中有利益冲突的地方就会有博弈,而现实生活中大多数博弈问题都属于非完备信息博弈,例如金融交易、军事博弈、政治谈判、棋牌游戏等,因此对相关问题的研究具有极大的经济价值和现实意义。非完备信息博弈由于信息不对称的特点,复杂的博弈背景导致决策节点数目呈指数级增长,传统的人工智能方法难以直接应用到非完备信息博弈中。针对以上问题,本文提出了使用对手建模和改进树搜索算法来解决非完备信息博弈问题,并将其应用到四人竞技麻将博弈中。本文的主要工作和创新点如下:1.结合知识和蒙特卡洛模拟方法构建对手模型来预测隐藏信息,并将其转化为相对概率。非完备信息博弈中存在巨大的隐藏信息,只依赖于可见信息可能导致较大的偏差,本文通过蒙特卡洛方法对每位对手的手牌进行模拟,结合时序信息、历史信息和相关领域知识设计了手牌的分配度计算方法,使模拟结果更加符合现实场景,最后将模拟结果转化为每张牌的获取概率和危险度表,为后续相关权重的计算提供重要帮助。2.根据麻将博弈的规则特点,设计了改进的树搜索算法用于探索获胜路径。首先,在分析博弈机理的基础上,简化了博弈模式,将搜索对象转化为手牌的更新过程。然后,使用了启发式信息设计了手牌拆分算法生成组合信息,基于组合信息设计了快速获胜、高分探索和改良探索三种策略从不同角度来提升搜索效率。最后结合胜率、得分和风险值评估,设计了攻守兼备的评估函数来计算最优解,通过对比实验验证了本文博弈决策方法具备了胜率高、得分高和风险低的优点。3.设计了基于知识的非完备信息博弈智能决策系统和测试平台。将设计好的决策模型部署到云服务器构建智能决策系统,通过云服务的方式提供决策服务,并将其应用到人机对战、辅助决策和博弈行为分析等功能中。搭建了测试平台来测试和评估系统的决策能力,建立了评估体系用于分析决策系统可能存在的缺陷,从而加快模型的迭代更新速度。基于以上方法开发的麻将AI程式“ZONST-KF-TREE”参加了由ICGA(International Computer Game Association)举办的 Computer Olympiad 2019 锦标赛,并最终取得了银牌的成绩,从实践上证明了本文方法具备相当高的决策水平和可操作性。
其他文献
文章简述了图书馆创客空间的研究现状,阐述了创客空间的概念及图书馆创客空间的建设情况,分析了基于PPP模式创建图书馆创客空间的可行性,以期为图书馆的创客空间研究提供借鉴
赣府厅字[2018]69号2018年7月17日各市、县(区)人民政府,省住房城乡建设厅,省卫生计生委,省旅发委,省财政厅,省国土资源厅,省交通运输厅,省商务厅,省科技厅,省新闻出版广电局
乱世出英雄,TNT2缔造新王朝 说起显卡市场,真可谓是王朝更迭频繁。从Trident到S3,从S3到3dfx再到NVIDIA,当今的显卡市场。即使有ATI的强力挑战,NVIDIA依然还是显卡市场上的王者。
赣府厅字[2018]112号2018年11月28日各市、县(区)人民政府,省政府各部门:为深化'放管服'改革,进一步提高政府采购效率和质量,根据《中华人民共和国政府采购法》《中
随着畜牧业的不断前进和发展,如何实现生猪养殖的方便化、自动化、规模化,已越来越走近人们的视野了。在当前,我国的个体户养猪大都还是以前的人工模式,只有部分大型的养猪场
当前高校图书馆主要应以知识经济时代为建设背景,以人文主义思想为建设导向,以提高员工能力为建设基础,以现代信息技术为建设手段,以标准服务流程为建设内容,以信息流通共享为建设
日常生活自理能力(activity of daily living,ADL)受损是老年人较为突出的一个健康问题,它严重降低了老年人的生活水平,对影响老年人日常生活自理能力的社会决定因素进行深入
长期以来,我国对政治经济学的研究局限在生产关系上,一方面,忽略了对生产方式的研究,即使研究了诸如协作与分工、产业结构、股份制和生产管理等生产方式内容,也是将这些问题归入到
古籍作为记录优秀传统文化的载体,不但具有珍贵的保存价值,而且古籍中包含的知识对当代社会仍然具有重要的借鉴意义。信息时代,图书馆也应与时俱进,创新古籍保护与管理模式,
通过建立D-gal人工衰老小鼠模型并进行藏灵菇发酵乳灌胃处理,测定小鼠脑指数;同时测定脑组织中总一氧化氮合酶(TNOS)、抑制性一氧化氮合酶(iNOS)活性和一氧化氮(NO)的含量变化,进一