基于CNN和MCTS的非完备信息机器博弈研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:chaoyue0130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从提出人工智能概念以来,机器博弈一直是最具挑战性的研究方向之一。机器博弈分为完备信息机器博弈和不完备信息机器博弈。不完备信息机器博弈的特点是玩家在博弈过程中无法获得所有的信息。现实世界中的许多决策问题都可以抽象为不完备信息博弈问题,例如机场规划,网络安全,财务和能源问题。因此,研究不完备信息机器博弈具有重要的现实意义。解决不完备信息机器博弈问题的传统方法是局部可观察的马尔可夫决策过程模型和强化学习算法。但是,强化学习不能在信息不完整和高维状态空间的情况下收敛。仅通过有限的数据和重复的测试就不可能遍历所有状态。本文提出了一种深度学习网络模型来解决一些不完备信息机器博弈问题中的大状态空间问题。由于引入了人类经验,因此基于神经网络的模型可以模拟博弈中的人类合作。本文提出了一种基于蒙特卡洛树搜索和简单风险模型的不完全信息博弈方法。本文使用深度学习网络代替强化学习中的状态作用值函数,解决了强化学习无法在高维状态空间中收敛的问题。本文将深度神经网络和改进的深度强化学习算法应用于信息不完全的机器博弈中,实现了二打一的机器博弈系统。与传统的学习算法相比,从感知到行动到端到端的学习策略达到了更高的博弈水平。改进的深度强化学习为大规模机器博弈系统的实现提供了一种可行的方法,也为将其扩展到现实生活提供了可能性。
其他文献
传感器是现代信息技术的三大支柱之一,中国的传感器经过了30多年的快速发展,但总体上还是落后于世界先进水平,因此国产传感器的发展必须走自主创新之路。
每个人都是长不大的孩子。当"六一节"已经成为我们共同期待的美好节日,选一份珍贵别致且充满童趣的礼物送给自己,让童心未泯的自己将快乐与活力无限传递。
高句丽史研究是中国民族史与东北民族史的研究重点,近年来出现了大批的研究成果,文章尽量全面回顾了2005-2010年间高句丽史的研究成果,并在此基础上对该领域的研究特点做了简要
机电暂态与电磁暂态混合仿真避免了机电暂态仿真对电力电子器件及其控制保护模型只能粗略模拟的不足,克服了电磁暂态仿真规模过小和仿真效率低的缺点,是解决交直流大电网仿真
分析了新媒体快速发展带给高校就业工作的机遇与挑战。结合实际,提出新媒体环境下合理利用新媒体加强高校就业工作实效性、针对性的具体措施。
《东丰农民画》,是个独特民间画种和审美特征的概念,是融中国传统和西方现代绘画理念的审美风范。东丰县农民画,色彩鲜艳、构图饱满、风格淳厚、凝重和谐。有人称其为“现代
作者将张仲景的“旋复代赭汤”和张锡纯的“参赭培气汤”化裁为“灵仙代赭汤”用于治疗食管癌。食入梗阻,吞咽困难者加急性子、礞石、磁石、黄药子;痰多粘滞、咯之不爽加栝萎、
经方治验二则梁风云河南省博爱县中医院(454450)蔡元龙河南省博爱县金城医院(454450)主题词@桂枝加大黄汤/治疗应用,肠套叠/中医药疗法,@大黄黄连泻心汤/治疗应用,胃疾病/中医药疗法笔者在临床中,对于疑
西安地铁2号线的开通标志着西安迈入了地铁的时代,本文以2号线地铁乘客为调查对象,运用随机抽样调查和统计学的相关方法,对广大地铁乘客进行调查,分析地铁出行的影响因素,调