论文部分内容阅读
近年来大量的研究关注了决策后反馈加工过程,深入地探讨了结果反馈信息如何促进强化学习以及相关的神经机制。早先,研究者利用事件相关电位技术发现反馈负波(Feedback related Negativity,FRN)。这一脑电成分反映了反馈加工的学习过程。FRN是在研究反馈评估的过程中发现在提供负性反馈250—300ms后,前额位置的脑电波上呈现明显的负向偏转。到目前为止,多项研究报告了不同学习效率者在强化学习过程中存在个体差异,并且表现在FRN的波幅上(Van&Segalowitz,2012;Gu et al.,2010),然而学习效率低的人群到底是对概率学习存在障碍还是对结果效价加工存在问题尚不清楚。实验1首先通过弗里兰德卡片赌博任务(Friedland,1998)筛选出不同学习效率的被试,然后让他们完成不同难易程度的时间估计任务,并在该任务中接受奖赏概率的操纵,同时记录脑电活动。实验的目的是考察不同学习效率者在不同奖励预期背景下的结果评价诱发的FRN波幅的差异。此外,也有研究提出不确定反馈信息会施加较强的影响,不带有明显正误信息的中性反馈可能诱发较大FRN波幅,然而关于中性反馈的研究结果并未达成一致。涉及不同反馈概率条件下的中性反馈的研究相对较少,且FRN波幅大小能否预见接下来任务中行为调整的程度还有待研究。实验2首先重复验证宋欣欣(2016)的实验任务,设置不同输赢难度的时间估计任务,从而达成不同奖励概率的效果,以此验证被试在不同奖励预期背景下加工中性反馈诱发的FRN波幅差异。同时我们又进一步考察中性反馈诱发的FRN波幅大小与后续的行为调整程度间的关联。 实验1结果显示,负性反馈相对于正性反馈会诱发较大的FRN波幅;预期外反馈相比预期内的奖赏反馈会诱发更大的FRN波幅。更为重要的是,本研究发现不同学习效率者在加工反馈效价时没有差异,然而意料之外的结果在概率学习高效者身上诱发较大的FRN波幅,这说明概率学习高效者对于意料之外的反馈信息比低效组更敏感。本研究证明在强化学习的结果评价过程中,概率和效价是独立的两种信息,强化学习效率存在障碍的个体可能来源于对这两种信息不同的敏感程度。为未来研究强化学习效率的个体差异提供理论参考。实验2结果显示,不同奖励概率条件下的结果评价诱发的FRN波幅间存在差异。预期外反馈相比预期内的奖赏反馈会诱发更大的FRN波幅。且奖励概率会对中性结果的评价加工产生影响。相比低概率条件,高奖励概率条件下的中性反馈会诱发更大的FRN波幅。究其原因可能是在高概率奖励的条件下,个体更容易获得正性反馈,因而中性反馈较预期更差进而产生更大的FRN波幅。但FRN的改变并不一定伴随行为上的调整,FRN波幅大小与行为调整的程度并不一致。