论文部分内容阅读
合作行为的产生及演化是极具挑战的科学问题之一。作为一种常见的利他行为,合作利他的产生及演化吸引了诸多经济学家的关注,个体利益最大化与集体利益最大化的社会困境却依然存在。依托博弈模型的合作行为决策理论作为定量刻画群体合作过程及个体利他行为表征的方法,是有效分析、预测与控制群体行为的基础与前提。随着演化博弈论和行为经济学实验的发展,经济学家通过分析经济人的行为发现了众多利他倾向的合作行为,利用多学科交叉的研究分析方法对合作行为的维持与产生进行了广泛且深入的分析。目前的理论研究发现合作行为的维持可以归结于五种互惠机制,即:直接互惠,间接互惠,网络互惠,亲缘选择,群体选择。这些互惠机制的表现形式虽然不同,但仍有着相同之处,博弈参与人并不会随机选择个体进行博弈,而是能够识别对手的合作行为。这种互惠模型只能解释在较窄范围内的合作演变。因此,强互惠合作模型为了克服基于上述互惠模型的局限性而被提出。强互惠者是指愿意牺牲自身的收益,奖励公平和惩罚不公平行为的个人,这种奖励与惩罚在经济学上称为正激励与负激励。尤其是需要付出成本的负激励机制被广泛的研究与探讨。为了探究负激励机制对利他合作以及利他决策的影响,通过设计强互惠机制的人类行为统计实验以及建立负激励机制的演化博弈动力学模型,利用统计实验、演化博弈、极限环理论、统计物理等方法,分别从实验和理论两方面研究负激励机制对合作行为的影响。具体研究内容主要分为以下五个部分。一、在正激励与负激励并存的囚徒困境统计实验研究中,通过在我国高校招募在校大学生志愿者,设计并组织了三场直接交互的囚徒困境博弈实验,这三场实验分别是:正激励与负激励机制并存的两人囚徒困境博弈实验(CDpr),只具有正激励机制的两人囚徒困境博弈实验(CDr),只具有负激励机制的两人囚徒困境博弈实验(CDp)。利用实验所获得的行为决策数据,分别对比分析了这三种机制下的行为演化结果。实验结果表明,负激励行为会降低正激励行为对合作促进的有效性及社会平均收益。在直接互惠的两人囚徒困境实验中,同一个体的正激励与负激励行为之间没有显著的相关关系。负激励出于个体的报复行为,正激励的动机是出于个体的亲社会属性所致。我们认为负激励并非对合作具有特定的促进作用,而是个体为了保护自己不受潜在竞争者威胁的自私策略。二、网络博弈中负激励的稳定及维持机制研究,我们探讨了多种负激励策略在结构化空间网络上的演化特征及演化规律。设置了两阶段博弈,第一阶段个体可以通过捐赠博弈做出合作或者背叛的决策。第二阶段,个体将对对手的第一阶段的策略作出回应,可以不惩罚,对合作者惩罚,对背叛者惩罚,即惩罚合作行为也惩罚背叛行为。结论表明惩罚成本与罚金对网络互惠的有效性具有影响。惩罚成本比较低时,反社会惩罚及任意惩罚行为将会破坏网络互惠效应,随着惩罚罚金的提升,反社会惩罚及任意惩罚的个体消失,网络被不惩罚的合作者与亲社会惩罚的合作者占领。而惩罚成本过高,会使得亲社会惩罚者丧失经济上的优势,网络互惠效应的互利优势不足以支撑高额的罚金,最终系统被背叛者主导。三、在耦合网络中负激励行为的稳定及维持机制中,我们探讨了不对称的负激励机制对耦合网络上合作演化的影响,其中惩罚只在位于不同网络层的玩家之间实施,同一层网络之间不实施惩罚。尤其是,只有上层的玩家才有权惩罚下层的球员,反之则不然。耦合系统中既存在亲社会惩罚又存在反社会惩罚。经过广泛的数值模拟,结果表明,如果惩罚成本相对较高,则两个网络中的策略存在协同现象,而且出现了逐渐演化的合作者团簇,团簇中的个体获得了更高的收益。然而,如果惩罚成本相对较低,协同现象不会出现,但合作依然会传播开来。结果表明,在不对称交互的情况下,合作的演变方式会发生变化。四、在环境反馈驱动下正激励与负激励对合作行为演化影响研究中,假定正、负激励行为是真实存在的,探讨环境-博弈相互反馈系统的演化动力学,其中公共物品博弈的增益因子被定义为环境正激励和负激励的组合。在具有突变的环境-公共产品博弈相互反馈的二维系统模型中,增益因子受环境状态和激励因子θ1和θ2的影响。区别于传统的惩罚与奖励策略,环境对个体的正、负激励效应并不是从个体的策略上体现,而是对公共物品增益因子的动态影响。我们客观地描述了在不同激励因子组合下群体的最终演化状态,并阐述了维持群体合作和避免公地悲剧的条件。突变率对此二维系统的动力学演化状态有显著的影响,并在一定参数范围内表现出公地的振荡悲剧。本章通过理论证明了震荡的公地悲剧是一种稳定的极限环,这可能对持续振荡策略的切换有新的解释。五、在具有退出选择的社会困境博弈中负激励对合作行为演化的影响研究中,我们假设,让玩家有权可以对博弈状态进行选择,两种状态分别为活跃状态(参与博弈)和非活跃状态(退出博弈)。但是在结构化群体中,主动退出博弈的个体在一定程度上破坏了原有的组织结构,主动退出博弈组的那些个体会收到来自第三方的负激励,即必须承担一定的罚金γ,作为他退出结构化群体的惩罚。结果表明,如果退出的罚金是中等的,系统能够达到全合作的状态,其中合作者在网络互惠机制的作用下可以迅速扩散。不活跃的参与者只能存在于合作者团簇的边界,这为团簇边缘的合作者创造了一个至关重要的缓冲区,使得边缘合作者避免了背叛者的入侵,由非活跃玩家的缓冲作用形成了增强网络互惠的基础。