基于标准的学生学业成就评价

来源 :基础教育参考 | 被引量 : 0次 | 上传用户:meirumen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 20世纪90年代以来,美国基础教育评价改革的目标是建立基于标准的评价和教育绩效责任制。文章以美国国家教育进展评估为例,介绍了基于标准的评价的背景、外部环境以及实践,在此基础上提出对我国基础教育学业评价的有益启示。
  [关键词] 基于标准的评价;美国;国家教育进展评估
  [中图分类号] G40-058.1[文献标识码] A[文章编号] 1672-1128(2010)03-0030-05
  
  “基于标准的评价”即“基于课程标准的评价”,课程标准是国家对学生学习结果的共同的、统一的基本要求,是学生学业成就评价的依据。评价之所以要基于课程标准主要是因为课程标准规范学业成就评价的设计理念,提供学业成就评价的维度框架,限定学业成就评价的内容范围和认知要求①。美国课程标准一般包括内容标准、表现标准和学习机会标准。内容标准划定学习的范围,描述学生应该知道什么以及能做什么;表现标准衡量学生对内容标准的掌握程度;学习机会标准是达到内容标准和表现标准应提供的保障,侧重于教育公平。
  随着我国新课程改革向纵深发展,课程研究理论和实践者开始逐渐关注学习者基于课程标准的学业水平,研究基于标准的评价已有了适宜的土壤;从世界范围看,美国可以说是基于标准的评价的先行者,本文通过介绍美国权威性的全国教育进展评估(National Assessment of Educational Progress,NAEP)来展示基于标准的评价的具体做法。
  
  一、基于标准的学生学业评价的背景
  
  
  20世纪80年代,《国家处在危险之中》等一系列报告从国际比较的角度表明,美国基础教育质量严重下降,不同种族之间教育不公平现象日益突出。于是,教育理论和实践者纷纷寻找原因。他们认为,造成这一现象的原因在于美国基础教育长期实行地方分权管理体制,造成课程上缺乏统一的标准和要求。在此背景下,20世纪80年代末,美国开展了轰轰烈烈的“标准改革运动”,改革的目标是建立全国统一的课程标准,改善教育质量低下及教育水平参差不齐的状况。经过10余年的发展,美国在课程标准的制定和实施方面取得了明显的进展,各专业协会在美国教育部的资助下相继制定了各学科的标准,于1996年完成了所有核心学科的全国性课程标准的编制。同时,各州在国家标准的基础上也纷纷制定了州一级的课程标准。截至1998年,几乎所有的州都完成了课程标准的制定②。
  在制定和实施课程标准的过程中,课程实践者逐渐将改革目光投向学习者的学习质量,以课程标准为基础开发评价工具、编制测验,并在部分年级推行州的学业成就评价,欲建立与课程标准相匹配的教育评价系统。1990年,与“标准改革运动”相呼应,美国国家教育进展评估(NAEP)开展了以州为单位的数学评价,并规定以后每两年进行一次州层面的数学和阅读测试③;1995年,美国又参加了国际教育成就评价协会发起的规模空前的“第三次国际数学与科学研究”。大规模的评价项目一方面为“标准改革运动”提供了大量的教育统计数据,另一方面也成为“标准改革运动”的重要组成部分,使教育评价达到了高潮,基于课程标准的学业成就评价日益成为人们关注的焦点。
  
  二、基于标准的学生学业评价的支持体系
  
  1.法案支持
  (1)《不让一个孩子掉队》法
  2002年,美国颁布了《不让一个孩子掉队》法。该法强化了基于标准的学业成就评价,要求学业评价要与州的学科内容标准相一致,将基于标准的学业评价推向一个新的高潮。该法提出的以州考成绩作为联邦教育部考核州一级教育质量依据的绩效责任制现已成为各州教育机构的工作重点④,这一举措将学业评价结果与问责联系起来,评价与标准、问责之间建立起更为有意义的联系。
  (2)各州政府的政策支持
  20世纪90年代起,作为“标准改革运动”的一部分,各州逐渐建立起教育问责制度,强化学校的绩效责任,建立了和学校相联系的奖惩机制,即对学业评价中表现优秀的学校予以奖励,表现差的学校予以扶助和惩罚。各州的这种政策性导向强化了对基于标准的学业成就评价的深入探讨,如NAEP作为一项法定权威化的评价体系,于2002年在州评估的基础上首次开展了对城市地区的试验性教育进展评估(Trial Urban District Assessment)⑤,确保了教育绩效信息和评价的可信度。
  2.文化支持
  (1)实用主义文化传统
  美国的实用主义文化传统决定了美国在基于标准的评价实践中必然选择改进技术这一最具操作性的实践路线,为基于标准的评价实践提供了重要的文化基础。
  (2)“问责文化”
  在美国,比起评价功能,大规模的教育评价对学生的测验更多地是承担问责职能。美国教育部《2002-2007年战略规划》的目标之一就是创造一种“问责文化”或“成就文化”(Accountability/Achievement Culture),从而将联邦政府教育拨款与学业评价结果的问责联系起来⑥,正是这种重责任、尚质量、求绩效的文化传统为基于标准的学业评价提供了良好的条件。
  3.技术支持
  目前,在美国各级政府的资助以及考试中介机构的技术支持下,美国已开发出多种检测评价与课程标准一致性的制度和工具,如韦伯模式(Webb model)、实施课程的调查模式(Surveys of enacted curriculum model)、成就公司模式(Achieve Inc.moedel)、基础教育委员会模式(Council for basic education model)等多元化的一致性分析模式⑦。
  
  三、基于标准的学生学业评价的实践
  
  NAEP是目前美国国内一项权威的中小学生学业成就评价体系。成立40年来,NAEP已周期性地对美国中小学生的阅读、数学、科学、写作、美国历史、公民学、地理等学科进行了全面测试,NAEP收集的数据和报道已被广泛用于美国教育改革的各种政策文本中,对美国教育产生了深远的影响。NAEP在基于标准的评价实践中已形成了一套比较完善的评价程序。我们可以通过NAEP的评价流程看出其是如何基于课程标准的。
  1.评价框架的制定
  评价框架是NAEP测试形成的依据,对各学科所要评价的内容领域、测试的题型、试题难度以及评分规则进行详细说明。1988年,NAEP的政策制定机构——全国评价管理委员会成立以来,一直负责评价框架的开发。NAEP评价框架设计科学严谨,评价领域的确定、维度的选取以及题目的设计紧紧围绕着课程标准展开。在制定评价框架时,全国评价管理委员会依据国家课程标准和评估水平,同时考虑州和地方标准,在此基础上确定各年级学生应该达到的知识和能力水平。
  NAEP评价框架集中了课程专家、评价领域的专家、州和学校地区的代表、学校管理者、政策制定者、教师、家长以及广大公众的智慧。首先,全国评价管理委员会通过竞标决定框架开发的合作者,如2009年数学评价框架是在各州教育长官委员会(Council of Chief State School Officials,CCSSO)与全国评价管理委员会的契约下,联合基本教育委员会(Council of Basic Education,CBE)以及成就公司等专业机构合作制定的⑦。接着,合同商与全国评价管理委员会旗下的各委员会(包括评价框架开发委员会、导航委员会、筹划委员会等)协同工作,经广泛讨论后起草评价框架。草案制定之后,合同商和全国评价管理委员会成员举行公共论坛从商业社团、测试专家、家长、学生等使用者那里获得反馈信息,了解他们所关心的问题,在修订框架时将这些因素考虑在内。最后,修订好的草案再送到专业机构、各地区学校、商业团体重审,对框架中规定的评价内容是否包括应有的内容标准、举出的样例是否恰当、框架中对每一内容标准所分配的题目数量是否合适等进行检验。经反复修订和审议,各方意见达成一致后,评价框架才得以成型⑧。
  NAEP评价框架涵盖评价学科的内容标准,详细阐述各年级要测评的内容领域,为了更加具体清晰,各内容领域都附有典型的样例帮助理解;在表现标准的一致性上,NAEP开发了基本、熟练和高级三种成就水平,以区分学生对课程标准的掌握程度,并对每种成就水平相应的表现进行清晰地界定和说明,还有相应的分数可以测定;在学习机会标准方面,NAEP设定的成就水平也涉及学习存在障碍、英语能力有限以及残障的学生。
  2.试题的编制
  在评价框架制定完成之后,全国评价管理委员会成员同考试签约商以及其他专业组织机构中的测验专家在熟悉评价框架的基础上,权衡框架中规定的内容、题型、试题难度、成就水平等编制大量试题。试题内容必须涵盖评价框架中规定的所有内容领域;试题类型要与框架中规定的三种成就水平相匹配;试题难度要与框架中描述的试题复杂程度相当。为了保证评价结果客观公正,评价试题必须排除种族、文化、性别以及地域偏见。为了保证试题与框架之间的一致性,NAEP的框架开发人员和试题编制人员至少有20%是相同的⑨。
  在试题编制完成后,有关专业机构对试题进行匹配( alignment of standards and assessment)检验和一系列的试卷分析,审查试题是否包含了评价框架的内容、每个题目的认知要求与框架中所描述的认知要求是否匹配,然后在全国范围内选择有代表性的学校进行试测,在对试测结果的数据分析中对试题加以修订。最后,经全国评价管理委员会各委员会的审查和筛选后方可进入NAEP的题库,这一系列的程序保证了NAEP具有极高的信度和效度。
  3.评价样本的确定
  NAEP是一种抽测型评价,评价样本包括试题样本和学生样本。
  由于NAEP试题库很大,不可能让每个参与评价的学生完成所有题目,因而NAEP采用题库抽样的方式。在试题编制完成之后,采用矩阵取样技术抽取部分试题,并将这些试题分成不同的组块(item blocks),编订成测验手册。每本手册中的试题内容、题型、难度和题目数量相当,且都满足NAEP测试内容和时间上的要求。一般来说,每个年级每门科目至少有20套测验手册。在测试时,每个学生只需完成一套手册中的题目,测验手册的发放是完全随机的,一所学校中只有很少一部分学生会做同一手册中的题目⑩。
  NAEP的学生样本覆盖各种类型和规模的学校、学区、不同性别和种族的学生,也包括学习存在障碍、英语能力有限以及严重残障的学生,从而保证了样本的科学性、代表性以及评价结果的信度和效度。在取样上,严格采用两阶段分层随机抽样,首先根据地理位置对学校进行分类,然后再根据少数民族学生数量进行分类,最后在每个类别中按照事先确定好的比例进行随机取样。NAEP选择参与的学校和学生的数量视评价科目和评价类型而定。一般来说,在一个仅有全国评估没有州评估的年份,每个科目通常需要各个年级6000到1万个学生样本{11}。
  4.组织实施
  为了确保所有学生都能公平、无歧视地参加评价,NAEP为有学习障碍的学生、英语能力有限者以及严重残障的学生提供各种方便措施,专门为他们制定了“适应性政策”,提供不同的试卷版本(不同语言)和考试形式(机试、笔试),并对执行这些特殊评价的人员加以培训{12},从而使所有学生都有平等的机会表现他们习得的知识和技能,体现了评价的公平性。
  5.评分
  NAEP评分标准界定清晰,可操作性强,并且提供了许多参考答案,有效地控制了评分过程中可能造成的误差。
  为了确保评分的可靠性和一致性,NAEP遵循严格的评分程序。首先,根据教育背景、工作经历和评分经验严格挑选评分者,评分者数量由评价规模决定。接着,对评分者进行培训,让评分者明确试题的设计原理以及评分指南。评分者要在掌握评分原则的基础上给出客观的分数,经检验合格后方能正式参与评分。在正式评分前评分者要再次进行测试,由多位评分者对同一试卷进行评分,当确认达到一致性要求时,才可以正式评分。在实际评分过程中,每组学生的试卷由两位随机组成的评分者来评,确保评分的准确与公正。另外,还要对每个评分者评分的质量与一致性进行监控与评价,不合格的要予以淘汰{13}。
  在评分技术上,NAEP基于项目反应理论,并采用学术界一致认可的参数估计软件(如BILOG和PARSCALE)进行项目参数估计,然后根据学生的作答情况和各种预测变量(如性别、年龄、种族等)估计学生的能力值。
  6.评价结果的报告
  NAEP不仅仅给出一门学科笼统的分数,而且按各具体的内容标准给分,具体反映学生在规定的学科领域中每一维度应掌握的知识、技能方面的成就,保证分数是基于标准的。如NAEP2007年数学报告卡中数学成绩是按照数与运算、测量、几何、数据分析与概率、代数等内容项出现的{14},见表1。
  除此之外,NAEP的评价结果是按照民族、种族、社会经济地位、学校地理位置、英语熟练程度和残障状况等分组报告的,严格保护学校和学生的个别信息,并且通过各州或地区之间的横向对比以及跨年度的纵向比较证明,不仅各个群体的学生成绩都得到提高,而且处境不利的学生与其他学生之间的成绩差距也在缩小,这样一方面减轻了学生和学校的压力,另一方面也体现了评价的公正性,有利于更好地向公众报告学生的实际水平。
  
  四、分析与借鉴
  
  基于标准的学生学业成就评价是一种专业性很强的评价行为,美国NAEP在基于标准的评价方面为我们提供了很好的操作模式,为我国评价改革提供了借鉴。
  1.进一步完善课程标准是“基于标准的评价”的前提
  课程标准是学生学业成就评价的依据,一个好的课程标准可以为评价提供良好的基础。NAEP较好地进行“基于标准的评价”的前提是因为其评价框架对课程标准中的内容加以具体化,设置了具体完善的评价内容,才使得评价做到有的放矢。NAEP在设定每门学科整体内容标准框架的基础上,对每门学科整体内容标准框架的具体内容也做了规定,并详细描述各学科各年级的成就水平,为评价的实施指明了正确的方向。
  相比之下,目前我国课程标准还不完善,在内容标准的具体化、清晰度方面还存在许多问题,从评价的角度看,“我国的课程标准看似一个缺少学习成果评价标准的课程内容框架,”{15}有些内容标准与表现标准混杂,很难为学生学业成就评价提供依据。因此,完善课程标准,使之具体、清晰、可操作是当前我国评价改革的当务之急。
  2.提高评价的专业化程度是“基于标准的评价”的关键
  即使课程标准非常完善,要使评价建立在标准之上也需要许多中间环节,从课程标准到评价需要许多技术上的考量。美国NAEP从评价框架的开发、试题的编制、取样、评分到报告都有着很高的专业要求,需要众多专业机构提供技术上的支持。
  反观我国,在学业评价的实践方面还相当薄弱,因而我国应借鉴NAEP的经验,一方面学习美国借助专业机构的力量,建立专业化的评价中介机构,另一方面要提高评价参与者对课程标准的解读能力、基于标准的命题能力以及评分能力,提高考试评价的专业含量。
  3.促进学生学习是“基于标准的评价”的最终目的
  在新一轮评价改革中,“为学习的评价”逐渐取代“对学习的评价”,成为“基于标准的评价”的指导思想。从NAEP的评价流程可以看出,其评价的核心理念在于“质量”和“公平”,在评价各环节都注重评价对象的涵盖性,考虑特殊群体学生,如在表现标准的制定上开发适合他们的表现标准,在评价实施中为他们制定了“适应性政策”,关注每位学生的需要和发展。
  相比之下,我国大规模考试(如中考、高考)过于强调甄别和选拔功能,竞争色彩浓重,往往忽视了评价的发展和监测功能。因此,我国应借鉴NAEP的成功经验,明确评价的目的在于改进学习,促进发展,同时要考虑学生的个体差异性,为每个学生提供合适的考试环境,提高教育质量的整体水平。
  
  注释
  ①崔允漷,夏雪梅:《试论基于课程标准的学生学业成就评价》.《课程·教材·教法》,2007年第1期,第13页
  ②李建华:《标准运动:美国90年代的基础教育改革述评》.《课程·教材·教法》,2000年第12期,第53页
  ③Ercikan,K. 1997.Linking Statewide Tests to the National Assessment of Educational Progress:Accuracy of Combining Test Results across States. Applied Measurement in Education 10(2):146
  ④侯威:《NCLB法案实施四年来美国公立学校的变化》.《比较教育研究》,2007年第11期,第66页
  ⑤U.S. Department of Education.The Nation’s Report Card 2007//Trial Urban District Assessment Results at Grade 4 and 8. 2007:2
  ⑥国家教育发展研究中心组译:《发达国家教育改革的动向和趋势(第七集)》[M].北京:人民教育出版社2004年版,第22-25页
  ⑦Mathematics Framework for the 2009 National Assessment of Educational Progress. NAGB. U.S. Department of Education[EB/OL].http://nagb.org/frameworks/reading2009.pdf.
  ⑧Jago,C.A History of NAEP Assessment Frameworks. Paper Commissioned for the 20th Anniversary of the National Assessment Governing Board 1988-2008.2009:5-12.
  ⑨NAGB.Item Development and Review. Policy Statement.2002
  ⑩Hombo,C.M. 2003. NAEP and No Child Left Behind:Technical Challenge and Practical Solutions. Theory into Practice,42(1):63-64
  {11}NCES.An Introduction to NAEP. U.S. Department of Education.2008:6.
  {12}Pamlmer,E.A.,
其他文献
[摘 要] 本文在对俄罗斯普通教育阶段学制与升学考试制度进行简要描述的基础上,通过介绍与阐释俄罗斯中小学校当前自然课程教学与考评过程中注重使学生掌握、运用探索自然所必要的基本科研方法,发展、维持学生的自然研究兴趣,开设可选修的自然课程,设计与采用结构化能力取向的测评考卷,以建构自然科学素养培育体系的新思路,力图使我国基础教育工作者能从一个新的侧面了解当前俄罗斯基础教育(特别是科学教育)的基本发展状
普者黑,位于云南省文山壮族苗族自治州丘北县境内,鬼斧神工的画卷山水和多姿多彩的民族文化构成了独一无二的山水秘境。  一部《爸爸去哪儿》,让大家知道了普者黑这个有点拗口,又特别美丽的地方。节目虽然早就结束,可普者黑变幻莫测的山山水水却深深印在脑子里怎么也忘不掉,好像总有个声音在召唤着。终于在秋季来临时,逮着机会直奔云南,就为了看一看心心念念的普者黑。  在云上行走  普者黑是彝语的音译,意为“盛满鱼
[摘 要] 办学理念是一所学校的灵魂。它体现着学校的办学宗旨、办学目标和办学策略,更具体地体现学校文化等方面的深刻意蕴和内涵。文章对广东仲元中学办学理念的意蕴和内涵进行挖掘,通过对办学理念的解读,探索如何把办学理念构建成学校的精神力量、文化氛围和理性目标。  [关键词] 办学理念;解读;构建  [中图分类号] G48[文献标识码] A [文章编号] 1672-1128(2008)08-0052-0
记者:今年是大连市金州新区开发区第七中学走过的第11个年头。请您谈谈学校以素质教育为指向的核心文化价值观是如何逐步完善、如何指引学校办学方向的?  牛朝霞:核心文化价值观是一所学校的灵魂所在。素质教育绝不仅仅局限在课堂上,更应在学校文化价值观的践行中有深刻的体现。校园文化的建设不仅对素质教育的实施具有导向和监督作用,校园核心文化价值观的树立和践行还往往对提升学生素质、塑造良好的道德品质、营造和谐向
2009年,蜀江锦院开设成都蜀锦织绣博物馆,让萧条已久的蜀锦、蜀绣等非物质文化遗产得到保护。  积累了资料,蜀江锦院在保留原有经典传统的基础上,开始创新使用新工艺、新技术、新材料,将现代时尚与传统技法相结合,创作出“燕翠宝蓝”“锦鲤”等系列首饰,在国际上举办专题展览。还携手加拿大艺术家创作“SHU ART”系列,以丝巾、包袋等时尚用品的方式展现锦绣之美。  將当代设计与传统手工技艺融合后,蜀江锦院
基础教育是涉及社会每一个家庭的重要问题,在加拿大政府民选的政治制度中,各政党为了赢得执政的社会基础,都不敢忽视这一社会高度关切的问题,因此,虽然各省经济发展水平有一定的差异,但基础教育投入差距并不大。  考察过加拿大社会的人,通常有这么一个感触,即这是一个儿童的乐园和老人的天堂。孩子们在基础教育阶段远没有中国的孩子们那么充满压力和辛苦,不像我们那些重负下的孩子那样少了许多童年和少年时代的乐趣。这其
一、改革开放30年来    我国民族教育事业发展的重大意义  1.加快民族教育发展是促进民族地区繁荣稳定的客观需要  各民族的团结统一和繁荣进步、各民族平等权利的保障、民族地区经济和社会事业的全面发展以及各民族自身素质的提高,都离不开教育事业的发展。当前,国际反华势力把民族和宗教问题作为“西化”和“分化”我国的突破口,国内民族分裂分子也蓄意挑起民族宗教事端,企图破坏民族团结和国家统一。我们一定要从
柔软的床、6人座的木餐桌、女主人收纳饰品的首饰台、客厅里的大木柜……在Nordic Space北欧空间的展厅,让人“回家”的感觉油然而生。  这场洋溢着北欧家居风情的设计展,由北欧可持续设计协会(SSDA)执行长Sofia He担任总策划。展厅木屋使用的木材、墙面、地板都来自于芬兰云尼卡拉木业(Junnikkala Oy)。  Sofia说:“森林是我们共同的未来”。云尼卡拉所有的操作规程都遵循可
日本文部科学大臣伊吹日前对记者说,如果国民同意的话,现在实行的学校每周5天学习制度,很有必要进行商讨修改。伊吹大臣说,恢复到原来的每周6天学习制度,教师的工作时间将增加,随之教师工资和教学大纲都要进行彻底的修改,因此,会对国民生活带来很大影响,需在倾听国民意见的同时,得出结论。学校每周5天学习制度是在贯彻“宽松式教育”指导方针的背景下,1992年由部分学校开始实行的,到2002年,日本全国所有学校
爱尔兰现代教育体系建立于20世纪60年代中期开始的教育改革。1963年,爱尔兰政府根据经合组织对爱尔兰教育考察报告《投资教育》的建议,开始对整个教育体制进行改革,大幅度增加了对教育的投入,其主要措施包括:实施10年义务教育、中等教育免费制度、改革中级教育、按地区建立技术学院等。(1995年实施大学免费教育。)此后,历届政府都保持该政策的稳定性和严肃性。经过40余年稳定的教育投入,一个较为完善、符合