奖励与强化:对动物行为及神经系统的影响

来源 :速读·中旬 | 被引量 : 0次 | 上传用户:dll_dll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  ◆摘 要:奖励与强化作为应激原,均可以帮助确定动物的特定行为,让动物习得某种动作。然而动物行为的改变是表象,奖励与强化实际上是通过影响动物神经系统来达到改变动物行为的目的。未来还需要更多的研究去探索奖励与强化对动物行为、神经系统的潜在作用,为动物行为学、动物训练乃至于药物成瘾的治疗提供更多帮助。
  ◆关键词:奖励;强化;动物行为;伏隔核
  一、奖励对动物行为的影响
  (一)食物奖赏对动物行为的影响
  1.食物奖赏的概念
  食物奖赏是指进食可口的食物后动物会获得一种满足感,这种食物能引发对动物的奖赏效应。即使不是饥饿状态,可口的食物会激活奖赏环路进而引发动物的摄食动机。因此,摄食的奖赏效应是促进动物持续摄食、提高摄食量的关键因素。
  2.食物奖赏的作用
  帮助动物习得某一特定行为。如:把大鼠放置于设置了有效和无效打扮的行为箱后,它踏有效板时给予蔗糖奖赏,踏无效板时无任何奖赏,一段时间后,大鼠会习得踏有效踏板的行为;将目标棒放在绿篮晰的面前,当绿篮晰嘴巴接触目标棒时,按响片同时给予食物以强化目标行为;训练红毛猩猩也采取相同的手段,若猩猩取得明显进步给予翻倍的食物奖励,这样可使得猩猩习得新的动作技能。
  增强动物的觅药行为。李彦庆等人对大鼠进行随机分组,分为蔗糖组和对照组,它们分别习得了蔗糖和普通食物的自给食行为。随后让两组大鼠进行自给药,大鼠踏板给予可卡因注射,第8天开始蔗糖组大鼠比对照组的踏板数更多,摄药量更大。
  3.影响食物奖赏对动物行为作用效果的因素
  低氧暴露后,大鼠在食物奖赏区域停留更久。王娟发现:将大鼠放入低氧暴露下的Y型迷宫并使其自由活动,与暴露在正常含氧量的情况对比,大鼠更倾向于停留在食物奖赏区域。
  (二)药物奖赏对动物行为的影响
  1.药物奖赏的概念
  药物奖赏是指动物长期反复服用成瘾药物后,其中枢神经系统会发生生理变化,渐渐地依赖该药物,称之为药物成瘾。可以通过药物奖赏使动物习得某种特定行为。
  2.药物奖赏的作用
  与食物奖赏作用相似,药物作为一种天然奖赏物,也可帮助确定动物的某些行为、学习某种行为。以下是药物奖赏有助于动物习得不同行为的证明。
  (1)长期停留在伴随成瘾药物的区域。条件化位置偏爱(conditioned place preference,CPP)实验是指在特定的环境下对动物反复给药,会让它喜爱或厌恶这个给药环境,从而选择逗留或者逃离。
  這一理论已被大量研究证明:如吗啡、氯胺酮、尼古丁这些药物都可以作为成瘾药物,让小鼠长期进入并停留在伴随该药物的区域中。
  (2)行为敏化。行为敏化是指反复使用成瘾药物后,动物的自主活动、旋转运动或刻板行为等精神活动刺激反应增强的现象。
  Castner等人发现重复给予苯丙胺可诱导非人灵长类动物(如猴子)出现跟踪、过度警觉、在空气中抓取寻找刺激物等幻觉行为。非人灵长类动物敏化后的表现较啮齿类动物更为丰富。
  (3)自给药行为。自给药行为基于斯金纳的操作式条件反射,可通过药物奖赏训练动物完成某一行为,如啮齿类动物学会压杆或鼻触,灵长类动物较多习得踏板或拉杆。
  Foll等人曾用松鼠猴为实验动物,建立自给药模型。松鼠猴坐在装有两个杠杆的房间里,杠杆上方分别有红光、蓝光刺激。每当松鼠猴拉动红光杠杆就会得到尼古丁注射,拉动蓝光杠杆则没有药物注射。一段时间后,松鼠猴学会了拉动红光杠杆自行给药。说明尼古丁这种成瘾药物可以使松鼠猴学会拉动特定灯光颜色的杠杆。
  3.影响药物奖赏对动物行为作用效果的因素
  (1)冷水应激的抑制作用。药物成瘾是一种脑损伤,而复吸是临床治疗药物成瘾遇到的最大难题,主要表现为觅药动机强烈和重复出现给药行为。实际上,药物成瘾是一种病理性情感记忆,有研究表明破坏药物奖赏记忆的再巩固能够抑制复吸。
  陈静研究发现:冷水应激可以抑制大鼠对吗啡的条件位置偏爱,且给药时间会影响这一抑制作用的效果。
  先让大鼠对吗啡产生CPP,然后唤醒药物记忆,再通过冷水应激的手段干预,结果吗啡对大鼠的奖赏效应被明显削弱。
  另外,只有在吗啡奖赏记忆激活后立即给予应激才能破坏吗啡奖赏记忆再巩固,若在记忆激活后6小时再给予应激是没有抑制效果的,说明冷水应激干扰吗啡CPP具有时间特异性。
  (2)运动应激的抑制作用。张鹿发现,运动应激可以抑制小鼠对氯胺酮而形成CPP。这里的运动应激指的是在小鼠用药后,进行增大运动量的跑台实验。
  (3)药物剂量影响作用效果。低剂量药物因药物浓度低而无法引发行为敏化;中等剂量药物所产生的非条件反应必须与与环境所产生的条件反应结合才能引发行为敏化;高剂量药物能够单独引发行为敏化。
  二、奖励对动物神经系统的影响
  (一)奖赏环路的概念
  1954年,詹姆斯·奥尔兹和皮特·米尔纳最先认识到脑内存在奖赏系统。他们设置了如下装置:按压按钮使大鼠接受大脑中的对特定部位短暂的电刺激。大鼠会慢慢习得按压按钮的行为,这种现象称为颅内自我刺激。研究者们将大脑内能够介导奖赏相关的行为的区域称为奖赏环路。
  (二)奖赏环路的分类
  正性奖赏环路和负性奖赏环路:前者增大奖赏效应;后者抑制奖赏效应。
  1.正性奖赏环路
  中脑边缘多巴胺(Dopamine,DA)系统是奖赏环路的中心。该系统主要起源于两个脑区:中脑腹侧被盖区(ventral tegmental area,VTA)和黑质致密部。VTA多巴胺能神经元主要投射到伏隔核(Nucleus Accumbens,NAcc)、内侧前额叶皮层和基底外侧杏仁核。此外,基底外侧杏仁核的谷氨酸能神经元可以通过NAcc间接投射到VTA。内侧前额叶皮层也能投射到VTA,这些脑区共同构成了正性奖赏环路。其中,VTA富含多巴胺能神经元,是调控奖赏功能的主要区域,这就是奖励对动物神经内分泌的作用的体现之一。   2.负性奖赏环路
  外侧缰核(lateral habenula,LHb)是负性奖赏环路的主要区域。研究发现,向猴子进行厌恶刺激会强烈激活LHb神经元;用光遗传方法激活大鼠脚内核到LHb的输入会使得大鼠厌恶、逃避所探索的环境。这都说明LHb参与处理和编码厌恶信息。这提示我们可通过激活LHb来抑制奖赏效应,从而治疗药物成瘾、抑制动物刻板行为的目的。
  LHb接收来自苍白球、下丘脑和前扣带回等脑区的输入,然后投射到VTA的多巴胺能神经元。这些通路共同构成了负性奖赏环路。
  三、强化对动物行为的影响
  由于强化与奖励有一定关系,可以通过奖励的手段使行为强化,这属于正强化,所以这里主要介绍负强化。强化与奖励类似,是对特定行为的加强,帮助动物习得某一特定行为,同时也有助于理解动物的刻板行为。
  (1)规避电击。偏爱黑暗的老鼠可以随意选择进入灯光室或者暗室,当它进入一个偏爱的暗室后受到电击惩罚,24小时后,老鼠选择进入灯光室,“电击+灯光”的环境条件使得老鼠因规避电击而学会进入灯光室。这属于负强化对动物行为的影响。
  相似的实验结果出现在果蝇身上:果蝇也会规避电击,通过这一厌恶型刺激使得果蝇习得某种行为。
  (2)规避气体。一定浓度的CO2会引起果蝇强烈的回避行为。但饥饿会抑制果蝇对CO2的排斥。高浓度的CO2对果蝇是致死,但为了生存,果蝇会减弱对CO2的回避,去靠近释放CO2腐败的水果(果蝇的食物)。
  在T型迷宫两臂分别通入OCT(某种果蝇厌恶的气味)和新鲜空气,果蝇会因为规避OCT而选择充满新鲜空气的区域。
  (3)规避苦味。印楝素是一种苦味剂,具有拒食、忌避、抑制生长发育、诱导凋亡和自噬等多种作用机制。
  动物形成味觉记忆后可利用它来回避有毒食物。昆虫口器伸展反应是分析昆虫味觉行为的一种经典的行为范式,能够快速地检测厌恶性味觉记忆的形成。
  用蔗糖刺激果蝇足部,同时将奎宁、印楝素等不同溶液让果蝇伸出口器取食。一段时间后用蔗糖刺激果蝇足部,其口器不再伸展。这是因为之前蔗糖的足部刺激伴随着印楝素这种苦味物质的刺激,形成了厌恶性味觉记忆,果蝇为了规避苦味,就会学会拒绝甜味。
  四、强化影响动物行为的神经机制
  能产生愉悦感的奖励刺激(如食物、金钱等)与正强化相关;撤销厌恶刺激时产生的放松感,与负强化相关。
  Kravitz和Kreitzer認为:接受腹侧被盖区多巴胺支配的神经元,在纹状体中组成两条平行的投射通路,其中直接通路从背侧纹状体的中型棘状神经元经过外苍白球投射到视丘下核,回返支配腹侧被盖区,选择性地表达低亲和性D1受体;间接通路从背侧纹状体的中型棘状神经元出发,投射到黑质网状和内苍白球的神经元,回返支配腹侧被盖区,选择性表达高亲和性D2受体。
  其中,正强化对动物行为及神经内分泌的影响与奖励相似,而负强化的作用在上文也已阐述,它可以通过让动物规避某一惩罚,而习得与之相反的另一选择所关联的行为,简而言之,强化作为应激原,也是帮助动物确定某一行为。
  综上所述,奖励与强化作为应激原,都可以帮助确定动物的特定行为,让动物习得某种动作。而动物行为的改变是表象,奖励与强化实际上是通过影响动物神经系统、内分泌系统来达到改变动物行为的目的。未来还需要更多的研究去探索奖励与强化对动物行为、神经内分泌的潜在作用。
  参考文献
  [1]李永祥,王嘉雯,江青艳,王丽娜.采食的奖赏性调节及其机制[J].中国畜牧杂志,2018,54(09):10-15.
  [2]李彦庆,乐秋旻,于向沉,马兰,王菲菲.蔗糖奖赏增强大鼠对可卡因的觅药动机[J].生理学报,2016,68(03):233-240.
  [3]唐华,左智力,毛杰,谢毅,陈建,刘选珍.绿鬣蜥行为训练研究[J].野生动物,2012,33(06):342-344.
  [4]李梅荣,窦海静,李俊娴.圈养猩猩的行为训练[J].野生动物学报,2014,35(01):62-65.
  [5]王娟.低氧暴露对大鼠摄食行为的影响[D].杭州师范大学,2013.
  [6]戚仁莉,瞿家桂,陈艳梅,马原野,胡新天.青春期小鼠与成年小鼠在吗啡和食物诱导条件化位置偏爱建立上的异同[J].动物学研究,2011,32(05):528-532.
  [7]张鹿.运动应激对氯胺酮成瘾相关行为的影响[D].中北大学,2014.
  [8]韩龙.尼古丁导致决策能力异常的神经机制探讨[D].中国科学技术大学,2018.
  [9]覃旺军,梁建辉.用药环境对药物敏化效应的调控作用[J].中国药理学通报,2011,27(12):1632-1635.
  [10]Castner S A ,Goldman-Rakic P S.Amphetamine sensitization of hallucinatory-like behaviors is dependent on prefrontal cortex in nonhuman primates[J].Biological Psychiatry,2003,54(2):105-110.
  [11]Foll B L,Wertheim C,Goldberg S R.High Reinforcing Efficacy of Nicotine in Non-Human Primates[J].PLOS ONE,2007,2.
  [12]Leshner AI.Addiction is a brain disease,and It Matters[J].Science,1997,278 (5335):45-47.   [13]Liu J F,Li J X.Drug reward memory: Implication from drug-induced conditioned place preference model[J].Chinese Journal of Pharmacology & Toxicology,2016.
  [14]陈静.应激损害吗啡奖赏记忆再巩固及其与脑内活性调节细胞骨架蛋白(Arc)的关系[D].福建医科大学,2014.
  [15]Tzschentke T M.The medial prefrontal cortex as a part of the brain reward system[J].Amino Acids,2000,19(1):211-219.
  [16]孙国林,张咏梅.中脑边缘奖赏系统参与阿片类药物成瘾的环路机制[J].中国药理学通报,2019(05):611-614.
  [17]吴静,崔睿思,孙翠翠,李新旺.奖赏环路与阿片成瘾:喙内侧被盖核的调节作用[J].心理科学进展,2019,27(01):60-69.
  [18]Hikosaka O ,Bromberg-Martin E ,Hong S ,et al.New insights on the subcortical representation of reward[J].Current Opinion in Neurobiology,2008,18(2):203-208.
  [19]Matsumoto M,Hikosaka O.Two types of dopamine neuron distinctly convey positive and negative motivational signals[J].Nature,2009,459(7248):837-41.
  [20]Shabel S J,Proulx C D,Trias A,et al.Input to the lateral habenula from the basal ganglia is excitatory,aversive,and suppressed by serotonin.[J].Neuron,2012,74(3):475-481.
  [21]Petzel A,Bernard,René,Poller W C,et al.Anterior and posterior parts of the rat ventral tegmental area and the rostromedial tegmental nucleus receive topographically distinct afferents from the lateral habenular complex[J].Journal of Comparative Neurology,2017.
  [22]董思萱.斯金納强化理论思想探析[J].科教导刊(上旬刊),2018(03):170-171+181.
  [23]Hikida T,Kimura K,Wada N,et al.Distinct Roles of Synaptic Transmission in Direct and Indirect Striatal Pathways to Reward and Aversive Behavior[J].Neuron,2010,66(6):896-907.
  [24]赵丽荣.电击抑制黑腹果蝇气味趋避行为的神经机制研究[D].湖南大学,2015.
  [25]程东美,张志祥,田永清,徐汉虹,江定心.印楝杀虫作用机理[J].植物保护,2007(04):11-15.
  [26]燕颍,顾怀宇,徐汉虹,张志祥.印楝素对果蝇厌恶性味觉记忆的诱导及多巴胺能神经元的影响[J].华南农业大学学报,2017,38(04):12-18.
  [27]尧丽,杨海帆,吴美霖,李永丰,段海军,任维.正强化和负强化:概念、争议与神经机制[J].心理科学,2017,40(05):1091-1097.
  [28]Kravitz A V,Kreitzer A C.Striatal Mechanisms Underlying Movement,Reinforcement,and Punishment[J].Physiology,2012,27(3):167-177.
  作者简介
  陈嘉卉(1997.10—),女,广东台山人,华南师范大学生命科学学院本科生。
其他文献
本文合成了聚苯并噁嗪二苯醚(PB-D)树脂和磁性聚苯并噁嗪微球(PBGA/Fe3O4)两种新型材料。研究了PB-D树脂的热稳定性和耐溶剂性。采用反相悬浮聚合法,基于胍和双酚A的苯并噁嗪(B-G-A)预聚体和Fe304纳米微粒通过自组装合成了PBGA/Fe3O4微球,并对其成球过程中自组装机理和影响微球合成的因素进行了探讨。采用扫描电子显微镜(SEM)、X射线衍射(XRD)、热失重分析(TGA)、振
◆摘 要:现今小班幼儿圆对于规范的认识相对比较模糊,且一些行为时常由着幼儿的兴趣进行转移,对此导致许多幼儿园的规章制度存在着不稳定性以及随意性。由于小班幼儿又具有较强的可塑性,展开家园合作,一方面能让家庭充分的了解自己的孩子,另一方面能增进彼此之间的感情,让幼儿的生活习惯能够让家长真切的感受到幼儿的转变,同时也适合幼儿养成良好的习惯。本文将对如何在家园合作中培养小班幼儿的良好生活习惯进行分析和探讨
收集2010年7月至2012年7月本院、德宏东方妇产医院及芒市胡菊兰诊所送检100例疑似尖锐湿疣的患者,通过患处湿疣取样提取总DNA进行PCR,扩增HPV分型基因,比较HPV-DNA阳性与病理
目的:探讨开展糖尿病专科健康教育讲座对优化门诊、住院患者掌握糖尿病预防及健康保健知识的需求和效果,通过引入多媒体信息技术及专业医务人员讲座提高糖尿病专科护理服务模
本文以柳州铁道职业技术学院为例,从打造“目标链”和“标准链”、构建8字形质量改进螺旋运行机制、完善制度体系和培育质量文化、优化信息化管理平台等四个方面阐述了学校推
◆摘 要:本文通过文献资料法和访谈等方法,对上海市中职校啦啦操课程的开展进行可行性的研究,得出:啦啦操作为一种很受学生欢迎的运动项目已经在上海市闵行区中职校中初具规模,并有广泛开展的形势。啦啦操是课程以团队合作和青春活力的面貌展示学生的风采,啦啦操课程在中职校的开展中有重要的价值,包括增强学生的体质,完善学生的性格发展,培养团队协作的意识方面都有很大的意义。  ◆关键词:上海市;中职校;啦啦操课程
我科是国家二级乙等综合性医院综合内科,承担着临床护生实习带教工作.而在临床护理工作中静脉输液工作一直都是我们常规工作的重点.因此,护生也特别注重这方面的工作,对于学
《语文课程标准(2011版)》在低年级学段目标中要求学生能掌握汉字的基本笔画和常用的偏旁部首,能按笔顺规则用硬笔写字,注意间架结构。初步感受汉字的形体美。养成正确的写字姿势和良好的写字习惯,书写规范、端正、整洁。当今信息化时代的来临,使现在的小学生刚开始学习就步入了少纸、无纸时代,经过调查,小学生在汉字书写方面存在一系列问题,诸如:执笔方法不科学,坐姿不正确,书写不规范,字迹潦草,卷面不整洁等等,
期刊
◆摘 要:正当防卫的必要限度一直是刑法研究领域的重要,但是由于我国刑法对其规定较为笼统,以至于刑法理论界和司法实务界存在争论。如何完善正当防卫必要限度问题,是当今中国社会亟需解决的问题。本文试图从英美我国的刑法界对于必要限度的理论进行研究,对完善此制度结合自己的思考提出一些粗浅的见解。  ◆关键词:正当防卫;必要限度;司法实践  一、问题的提出  正当防卫的必要限度在正当防卫研究层面一直处于核心地
◆摘 要:目的探讨营养干预对GDM孕妇妊娠结局的影响。方法选取2018年10月—2019年6月本院门诊收治的GDM的孕妇中随机选择300例为研究对象,其中接受营养干预的150例孕妇为观察组,未接受营养干预的150例为对照组。对照组为常规干预,观察组给予个体化的营养干预,对比孕产妇以及新生儿并发症几率。结果观察组孕妇羊水过多、高血压、产后出血胎膜早破、发生率均显著低于对照组,具有统计学差异(P<0.