【摘 要】
:
机器博弈是人工智能领域一个既古老又具有挑战的问题,为人工智能成果的验证提供了一个良好的平台。非完美信息博弈问题是机器博弈问题的一个重要的分支,由于这类博弈问题具有
论文部分内容阅读
机器博弈是人工智能领域一个既古老又具有挑战的问题,为人工智能成果的验证提供了一个良好的平台。非完美信息博弈问题是机器博弈问题的一个重要的分支,由于这类博弈问题具有非完美信息,即参与者需要在只知道对手的部分信息的情况下做决策,因此,更接近现实世界中的决策问题,具有更高的研究价值。本文针对非完美信息博弈问题的关键算法进行了研究,尤其是具有大空间和高复杂度的非完美信息拓展型博弈问题,并在幻影围棋中对本文提出的算法的性能进行了分析,比较了不同算法的效果。本文以非完美信息拓展型博弈问题为基础和基本模型,给出了基于信念状态的非完美信息博弈问题的数学模型。在此模型的基础上,对非完美信息博弈问题的关键算法进行研究,提出了利用信念状态树的数据结构表示非完美信息博弈问题的博弈过程,以蒙特卡洛树搜索算法为基础,提出了信念状态-蒙特卡洛树搜索算法并应用于处理具有非完美信息的博弈决策问题。本文在信念状态-蒙特卡洛树搜索算法的基础上,提出了两种基于对手模型的信念学习算法,分别是在于部分偏执的信念学习算法和基于随机最优反应估计的信念学习算法,旨在利用非完美信息博弈问题的隐藏信息通过建立对手模型的使参与者获得更高的收益。之后,将信念状态-蒙特卡洛树搜索算法应用到幻影围棋博弈问题中,提出了幻影围棋博弈问题中信息的处理方法,并结合幻影围棋博弈问题的特点,给出了基于信念状态-蒙特卡洛树搜索算法在幻影围棋博弈问题中的改进算法进行了研究,提出了三种改进算法,包括混合策略、AMAF启发算法和信息探测。最后,在幻影围棋博弈问题下,对信念状态-蒙特卡洛树搜索算法的性能进行了分析,对两种信念学习算法的性能和效果进行了分析和对比,并且,对基于幻影围棋博弈问题的改建算法的效果进行了测试。
其他文献
搜索引擎给互联网带来了巨大的变化,使得人们能够在浩如烟海的知识世界中,获得自己想要的信息。搜索引擎技术也已经成为信息检索的热门技术。RSS信息聚合技术在新闻和博客领域
二十一世纪世界经济发展的一个重要特征是竞争。在竞争日趋激烈的环境中,供应链中的分销企业如何获取有效的市场信息,如何准确预测分销需求和制定行之有效的分销计划,如何合理规划分销体系的业务,是制造企业和分销集团面临急需解决的重要问题。伴随互联网络的出现和飞速发展,世界经济进入到一个崭新的以信息化为主要特征的电子商务时代。新的形势在加剧企业竞争程度的同时,也给企业所面临的问题提供了新的解决思路。本文首先探
随着人类基因组计划的完成,人们逐渐从对结构功能组学过渡到功能基因组学的研究。科研人员也在长期的研究中积累了大量的生物学知识,建立了许多比较完善的数据库。适当的利用
随着计算机网络技术的不断发展,网络安全问题也变得越来越突出,其中局域网中的通信和数据安全是当前网络安全领域研究的热点之一。传统的网络安全技术如防火墙等只能保护局域
随着互联网技术的迅猛发展,博客、微博等社交网络应用已经成为人们获取资讯的重要途径。社交网络具有自由性、开放性、灵活性等特点。一方面社交网络促进了信息的流通,另一方
现实世界中的诸多系统都以有向复杂网络形式存在,要保证这些系统的正常运作,就必须对整个系统进行控制。把复杂网络映射到线性系统上,利用二分图的最大匹配算法,非匹配节点作
随着互联网络骨干带宽的不断升级扩容,用户获取高速接入Internet的需求同昂贵的互联网络接入费用形成了高校校园网络发展的一个主要矛盾。而一个适合本校校园网络环境的认证
供应链在长期的经营过程中,其市场、成员企业和所处的环境都是不断变化的,供应链内部和外部环境的变化使得当前的供应链网络布局越来越不适合企业的发展。网络布局的不合理导致供应链的成本、交货期不断增大,客户满意度也随之降低。要提高供应链整体竞争力,减少成本和提高服务水平,就必须适应变化,调整优化供应链网络。供应链集成网络的优化一直是供应链优化领域的研究重点,目前在供应链的网络优化方面做得比较成熟的是供应链
本文主要探讨了坦克战模拟系统设计和实现。详细介绍用于辅助本系统实现的3个邻节点计算算法,它提高了A*算法效率。同时研究了改进的MVC设计模式,并就基于MVC的坦克战模拟系