与AI一起“石头剪刀布”

来源 :知识窗 | 被引量 : 0次 | 上传用户:zhangduanhua0505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  自从AI出現后,在很多竞技类游戏中,人类都败给了AI,最著名的就是1997年“深蓝”击败国际象棋大师卡斯帕罗夫事件。对于AI击败人类,有些人表示不服,认为AI之所以能击败人类,是它掌握了更多的信息,能根据算法预测出人类的“套路”,如果在随机游戏中,比如“石头剪刀布”这种没有规律的游戏,AI不一定赢得过人类。事实真的是这样吗?
  在人们的一般认知里,“石头—剪刀—布”三种出法随机出现,相互克制。每次出手只会有三种结果,即输、赢和平局,每次玩家获胜的概率都是三分之一。这种游戏看起来很公平,而且充满随机性,所以在生活中,当遇到问题无法解决时,人们便非常乐于通过这种小游戏来做选择。但是,这种游戏真的是随机的吗?答案是否定的。
  浙江大学何赛灵教授的研究团队开发了一个基于马尔可夫链的AI模型,专门用来玩“石头剪刀布”游戏。游戏的规则是:赢了加2分,平局加1分,输了不得分。为了确保人类玩家能尽可能地按照自己的想法出拳,杜绝乱选或者放水,游戏设置了金钱奖励,总分越高,得到的奖励越多。但是,在与52个人类玩家分别大战300回合之后,AI击败了95%的玩家。在最悬殊的一场较量中,AI获得了198次胜利,55次平手,仅输了47次。实验总计进行了15600次,最终结果表明,在这个游戏中,AI大概率击败了人类玩家。如果“石头剪刀布”游戏真的是随机的,面对如此大的样本,AI根本不可能占有优势。
  这里面有什么玄机吗?确实有。从本质上来看,“石头剪刀布”属于博弈问题,其背后蕴藏着经典的纳什均衡,而每个个体的习惯、认知和策略都会影响实际胜率。比如你和对手很熟悉,那么你可能知道他(她)经常出布,因此可以多出剪刀来克制。科研团队提出的AI模型就是利用了类似的原理,证明了“石头剪刀布”真的存在针对不同个体的长期制胜策略,可以有效提高胜率。
  这套AI模型基于n-阶马尔可夫链设计,拥有记忆性,能够向前追溯最多n个历史状态并加以利用。为了增加AI的胜率,研究团队还针对人类玩家的不同性格和策略发明了一套Multi-AI模型。这套模型含有多个锦囊,如果人类玩家连续胜利,就会促使Multi-AI转向选择其他AI模型的更优解。如果人类玩家连续失败,大概率会转换策略,或者打破之前的出拳规律,这时Multi-AI也可以随之调整。所以,人类玩家最终大概率还是会输。
  由此可见,玩“石头剪刀布”,人类确实玩不过AI,因为AI足够聪明,它总能根据既往数据和当前对手的特点,找到人类玩家的漏洞,进而取胜。但是,你认为AI仅仅用于“石头剪刀布”吗?其实它的用处太多了,它可以是一个很厉害的循环制衡模型分析师,未来有望拓展到其他博弈场景,比如预测竞争对手的下一步举动、规划更有效的竞选策略,或者制订更有利的定价方案等。
其他文献
烟花三月,春暖西湖,柳枝绽绿,樟树换新。桃花、梨花、樱花、玉兰花、海棠花……吮吸着春的养分,这些花儿竞相怒放着,五颜六色,点缀着秀美的西湖。
湖南是一片红色热土,有着深厚的法治文化历史渊源。最高人民法院原院长谢觉哉,就是从胡南走出的一位具有深厚法治思想的无产阶级革命家。
湖南是一片红色热土,有着深厚的法治文化历史渊源,也留下了丰富的法治文化历史资源和档案。这些珍贵的文物史料,见证了湖南法院的沧桑风雨、日新月异,也折射出法院人忠诚干净担当、公正为民司法的不变初心。
知乎上有一个热门话题:“原生家庭非常幸福是怎样的体验?”引来500多万次浏览,其中一个回答:“我多么希望我能回答这个问题。”却有上万网友默默表示赞同。家庭,百度百科给的定义是指在婚姻关系、血缘关系或者收养关系基础上产生的,以情感为纽带,亲属之间所构成的社会生活单位。
说起来是20多年前的事了。那天,我刚刚乘上南行的列车,天空就乌云密布。一会工夫,瓢泼大雨斜打在车窗上,车厢内闷热,气味难闻,车窗外的风景也,变得模糊不清。
目的探讨糖尿病性黄斑水肿(diabetic macular edema,DME)与肾功能受损及其严重程度的相关性。设计回顾性病例系列。研究对象2016年1月至2020年12月北京老年医院内分泌科住院患者中在眼科会诊的2型糖尿病患者1023例。方法通过调阅病历获得研究对象的年龄、收缩压、舒张压、血肌酐、空腹静脉血血糖、糖化血红蛋白以及尿微量白蛋白。应用CKD-EPI scr(2009)公式计算估算肾小球滤过率(estimated glomerular filtration rate,eGFR)。eGFR≥9
女性71岁,右眼异物感、眼红、视物不清1年。诊断为右眼角结膜鳞状细胞癌,予1%5-氟尿嘧啶滴眼治疗3个月后痊愈,随诊1年无复发。(眼科,2021,30:244-245)。
目的观察虚拟现实技术在眼科临床教学中的应用价值。设计前瞻性随机对照研究。研究对象2019年3月至10月在西南医科大学附属医院眼科实习的本科学生48名。方法将48名学生随机分为两组,实验组24名,对照组24名。实验组实施虚拟现实技术教学,对照组实施传统方式教学。教学主要内容为眼的组织解剖和生理生化,由6名带习教师随机分配进行教学,每次教学时间均为120分钟。课后及课后1个月分别对学生进行一次试卷测试,课后对学生和教师进行一次问卷调查。主要指标试卷测试和问卷评分。结果实验组的课后试卷测试平均成绩(90.63±
期刊
去扬州,我观赏了被誉为中国四大名园之一的“个园”。其中,清颂堂的中堂楹联是:“几百年人家,无非积善;第一等好事,只是读书。”读书,是常说常新的话题,如同在日月雨露风霜的沐浴氤氲下,日日新,时时新;物物新,事事新。  人们捧卷而读,是想与先圣对话和交流,会一会有思想的古人。因书籍承载了他们的沧桑与智慧,虽说千百年已经过去,作者的思考追索,在岁月中沉沉浮浮,可在读那些书籍时,我们仍能领略到这些先圣的智