基于博弈策略与迁移机制的群体合作演化研究

来源 :大连理工大学 | 被引量 : 4次 | 上传用户:soochow_deer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自人类社会产生开始,合作问题就一直是影响人类发展的重大问题。个体都是在自利的动机下采取行动,共同利益并非个体行为的直接原因,理性的合作不一定必然出现。这引发了关于合作是如何在由自私个体组成的群体中产生以及演化这一问题的研究。博弈论为研究个体之间的合作关系形成提供了有力的理论框架。目前在合作演化问题研究领域,学界提出了包括直接互惠与空间互惠在内的五种促进合作的机制,并且围绕着信誉、迁移、教育活动等诸多机制展开研究。但迄今人们对于群体合作行为的演化机制、影响合作的环境因素以及基于个体迁移机制的动态交互关系下合作的涌现机理的认识还有待进一步深化与拓展。因此,本文从个体的博弈策略研究与个体迁移机制研究入手,采用基于Agent建模的计算机仿真实验方法,从宏观现象与微观分析两个层面对以上问题展开深入探究,针对均匀混合群体、静态交互网络、动态交互网络三种问题情境,分别从博弈策略、策略更新机制、个体迁移机制提出了相应的促进合作涌现的机制,并对这些情境下涉及到的影响合作策略演化的因素进行了探究。首先,本文聚焦均匀混合群体下有噪音的重复囚徒困境博弈。本文提出了一种灵活互惠利他策略(FRAM),在该策略下博弈者对于对手的背叛行为会保持一定程度的容忍,并能够为了长期回报而继续采取合作的策略,持该策略的个体,其决策基于与对手长期交互的历史,噪音带来的意外影响不会立即打破两个参与者之间的长期合作关系。本文采用生态演化模拟实验的方法发现FRAM和CTFT策略的抗噪性能更强,而TFT策略在低噪音环境中容易胜出;此外个体间交互频次越高越有利于合作的策略,交互频次降低的过程中,合作策略逐渐失去优势,当交互频次小于3时,博弈等同于单次博弈,背叛策略成为最优策略。本文研究表明,基于个体长期记忆的策略抗噪能力强,在个体交互频繁的环境中表现出更大的优势,同时也说明环境对博弈策略演化的影响是巨大的。其次,本文聚焦静态网络博弈情境,针对现有的策略更新机制大多采用取代机制这一问题,提出了基于相邻个体收益差的渐进策略学习机制,假定个体策略为完全背叛策略到完全合作策略之间的连续值,个体在执行策略学习时,策略变化的程度基于自身与学习对象间的收益差值,学习对象的收益相比于该个体差异越大,策略调整的幅度则越大,个体对差异的敏感程度会影响策略调整。研究发现当个体对收益差的敏感程度较小且个体获知邻居收益信息的数量较少时,相比于取代机制,本文提出的机制能够使系统合作水平大幅度提高,原因在于合作者与背叛者间会形成策略居中隔离带,使合作者簇很难被背叛者入侵。本文研究表明渐进机制相比于取代机制演化更加稳定,抗随机性更强,特别是在背叛诱惑较大的情况下,依然可以促使系统涌现出合作行为。之后,本文聚焦动态交互关系下的合作演化问题,提出了基于个体演化偏好的策略模仿与位置迁移的协同演化机制,为了体现个体对邻居收益信息的掌握程度,引入了策略模仿收益依赖参数,为了体现移动目标空位信息从无到有,引入了迁移空位信息噪音参数。通过平面二维网络上的仿真研究发现,当个体所掌握的邻居收益信息精度居中且迁移空位信息精度较高时,较大的策略模仿偏好或者较大的迁移偏好都可以实现合作的爆发式扩张;居中的无倾向的演化方式不利于合作。本文揭示了在迁移机制的作用下,个体不但可以通过传统的以策略模仿为中心配以少量移动的方式来促进合作,还可以通过以迁移为中心配以缓慢模仿的方式来实现合作的涌现。研究结果同时表明在种群密度较低的环境下后者更加有利于合作。最后,本文聚焦动态交互关系下的趋利移动带来的局部背叛者团簇问题,针对这一问题提出了两种混合移动机制:趋利移动与逃离移动的混合移动机制(PDMMP),趋利移动与全局平均收益驱动的混合移动机制(PDME)。并且将这两种机制与混合了随机移动的趋利移动机制(PDMR)作比较。通过实验发现,当群体密度较大时,趋利移动促进合作的效果更为显著,此时混入少量的其它移动机制(随机、平均收益驱动、逃离)可以大幅度促进合作;当群体密度较小时,在趋利移动中混入高比例的逃离移动以及中比例的平均收益驱动移动则更加有利于合作。混合迁移机制PDMMP和PDME对合作的促进作用都显著优于PDMR;PDMR机制下,如果混入的随机移动的比例超过一定阈值,则对合作起抑制作用。本文揭示出趋利移动与其他移动方式的混合移动机制更够抑制局部背叛者团簇的出现,从而进一步促进合作的传播与扩散。
其他文献
一、农业产业化经营如何深入发展 所谓产业化经营,就是要以产、加、销或农、工、贸“一体化”经营的思路,把一个地区农业生产与市场经营通盘安排在一个系统之中,减少经营成本,合
<正> 一、前言雷克伍德大桥是穿越奔宁山脉(pennies)的M62汽车专用道上最重要的建筑物。M62联接莫西萨德、曼彻斯特、西约克郡和汉莫萨德等聚居中心。自1971年开启交通以来,
近日,卫星频率和轨道资源管理及应用研讨会在北京召开,会议由国家无线电监测中心/国家无线电频谱管理中心主办,中心内容主要着力于提高对卫星频率和轨道资源的重视程度和获取
结合工程实例,对某高边坡工程土方开挖的难点进行了分析,阐述了土方开挖前的施工准备工作及开挖的施工工艺流程,并探讨了土方开挖的质量与安全保证措施,以达到预期的施工效果
文中阐述了经济人假设的含义及其对我国制度构建的价值。只有全面理解亚当&#183;斯密的“经济人”假设,才能够真正理解为什么他能够提出自利的个人追求自己利益的同时能够促进
针对接驳地铁的公交线路站台分配不合理现象以及由此引起的公交站台利用率不均衡、服务水平较低等问题,本文以乘客总换乘距离最短、公交排队进站总等待时间最小为目标,使用ε
随着国内金融自由化的不断发展,保险公司与银行的合作已经成为了顺应金融服务一体化的大势所趋。从20世纪90年代我国出现银行保险以来到现在,银行保险业务已经发展成为保险公
中国古代文化中的官文化和小农意识的普遍存在和残留体现于社会生活的各个方面,其主要表现有:官本位和官至上的价值观和道德观;长官意志决定论;官僚主义作风;反对竞争;贫富均
随着人工关节工艺、材料质量的不断提高及医疗技术的不断发展,人工髋关节置换治疗老年性股骨颈骨折日益增多.笔者对2002年1月~2006年10月在我院接受治疗的60岁以上的老年移位性
高速公路路基施工中,难免会遇见施工高边坡的情况,高边坡施工的危险性大,稍有不慎可能造成严重的安全事故。因此非常有必要对高边坡的施工工艺进行探讨。因此,本文结合相关的