论文部分内容阅读
摘 要: 随着语言测试理论的不断发展,多项选择题的效度受到了关注。多项选择题在不同的效度中有不同的表现,但是整体效度有很大的局限性,而如何提高其效度也一直需要进一步的研究,在测试中要尽量扬长避短,从而保证测试的效度,达到既检验教学效果又促进教学质量提高的目的。
关键词: 英语测试 多项选择题 效度
随着我国英语教学事业的蓬勃发展,英语测试显得日益重要。根据教育测试学理论,测试在教育中占据重要位置。教学通过测试来检验其效果,进行教学评估;而测试又会对教学产生有利或有害的反拨作用(washback effect)。因此,要充分发挥测试对教学的正面影响,提高测试效度就成为关键问题之一。而在语言测试中,多项选择题,简称MC题型,是近几十年来使用最广泛的题型,尤其在一些大规模考试中,如高考,大学英语四、六级考试,研究生入学考试,出国人员外语水平考试,等等。多项选择题不仅成为决定外语测试有效性的关键因素,而且对教师的教学和学生的学习方法与态度产生了不容忽视的影响。本文旨在对多项选择题的效度进行分析,探究提高其效度的方法。
1.理论基础
多项选择题是典型的心理—结构测试阶段的测试手段。它最初创立于心理测试。上世纪二十年代初,以多项选择题型和是非题型为代表的客观测试开始在美国教育界包括语言学科中使用,并迅速获得承认;三十年代,心理计量学的发展进一步促进了客观测试手段的应用;到五十年代,客观语言测试已经在美国教育性语言测试中占主导地位;在六十年代许多结构主义语言学家和教育心理学家开始研究语言测试问题,并用测量学的方法计算测试的信度和效度。他们非常注重客观性测试,随着交际测试的倔起,八九十年代多项选择题在交际测试中渐成主流。
一道多项选择题通常由题干和3—5个选择项组成。选择项通常包括一个答案项(或称正确选择项),以及若干个干扰项。这种类型试题称为填空性多项选择题。一种常见类型为取代性多项选择题,通常用于测试考生的词汇和结构知识。命题者给出一个完整的句子作为题干,把其中要考的词用下划线标出,要求考生从所给的选择项中选取可以放到句子中取代下划线部分的答案项。
2.效度
效度通常是指测试的恰当性或者测试的任何组成部分发挥出其测量的作用。有效的测试应该能够测试出其应该测试的东西。测试有各种作用与目的。错误使用效度,测试在某些时候是有效的而在某些时候却是失效的。效度一般分为五种:表面效度、结构效度、内容效度、共时效度和预测效度。结构效度也称观念效度或理论基础效度,是指测试是否以有效的语言观和语言学习观为理论根据。观念效度是语言测试的主要效度,是一切其它效度的基础,与观念效度密切相关的是内容效度。内容效度是指测试的内容中两种相互关联的性质,即测试内容与测试之间的相关性;测试内容与测试的目的及与学习目的之间的相关性。观念效度和内容效度属语言测试的内在效度。共时效度和预示效度属外在效度,它们指测试结果在多大程度上与一些外在标准相关,故又称标准参照效度。表面效度是指测试从外观看上去被人接受的程度,即看上去是否考了它应该考的。因而具有表面效度的测试容易引起应试者的兴趣。
2.1 MC题型的表面效度
表面效度强调的是测试对于测试者是否呈现出它所要测试的内容。MC试题采取一题一考点的方式,每道题只测试一个语言点,非常有针对性。教师可以及时准确地了解学生的掌握情况和教师的教学效果,测试的表面效度较高。考生在回答MC试题时,只需在答卷上书写符号或在答题卡上涂黑相应圆圈,比自行书写答案耗费的时间要少很多。所以在相同的时间限制内,MC试题可以测试更多数量的试题,可以覆盖更多的语言点,如语音、词汇、语法、阅读理解和完形填空等,测试抽样量较大,测试内容覆盖面较广,意味着测试的覆盖面较全,即考试结果的可靠性和稳定性相对较高。MC试题编排上可视测试需要而定,少则几十题,多则上百题,使试卷有较大覆盖面,从多方面测试受试者水平。根据测试的不同需要,还可降低或增加测试难度。比如选择项数量可三选一或五选一不等,还可与其它题型构成混合题型。MC试题在拼几道平行卷时也比较方便,换一换题干或选项顺序,或删改个别干扰项就可迅速完成任务,测试手段比较灵活。因此,MC试题的表面效度相对较高。
2.2 MC题型的结构效度
结构效度是整个效度中最基础、最重要的要素。甚至,有时候用来代替效度本身。结构效度主要包括考生所掌握的各种语言能力和语言知识,例如写作能力,口语的流利性,或者是对语法知识的掌握,等等。而这些知识和能力就成为语言测试测试的内容和对象。根据对MC试题的理论基础的分析,如果MC试题定位的结构效度,是语言知识,该测试手段在这样的语法测试中具有高度的结构效度。这也是,为何多项选择题在心理—结构测试阶段十分盛行,并至今仍被广泛采用的原因。
并且随着语言学的发展和各种语言学派的交流融合,MC试题的结构效度的局限性就日益暴露出来。分离式的测试将语言分割成孤立的元素,那么语言的综合能力就无法在这种试题中体现出来。同时由于语言的社会性,语言使用者的心理,认知等因素也被考虑到实际的语言使用中,很明显,对于语言能力的定义早突破了传统的语法知识。由此可见,MC试题的结构效度几乎为因为它已经和多项选择题的理论基础相背离了。它的设计和解答都和实际的语言使用相距甚远。MC试题虽然能够成功地测得考生对语言知识的辨认能力,但较难测出考生运用语言知识的实际能力。如在以MC试题出现的结构和书面表达部分能拿高分的考生,并不一定表明其能够自如运用这些语法结构知识进行书面或口头交际。甚至有少数语法部分得高分的考生,耳不能听,口不会说。这就给MC试题的结构效度打了折扣。经过多年研究,一些测试专家指出,多项选择题只能测试考生的语言输入能力,如听和读,但不能测试考生的语言输出能力,如说和写。因此,MC试题的结构效度在当前的测试理论之下的局限性突出。
2.3 MC题型的内容效度
内容效度强调的是测试内容与测试之间的相关性,测试内容与测试目的及学习目的之间的相关性。一个对学生至关重要的考试若单纯采用MC题型,则很可能对语言学习和教学产生负面影响。MC题型成为使用最普遍的测试手段的主要原因在于它较高的表面效度和信度。但是,MC题型并不是有效的教学手段,在教学中大量操练MC题将对教学造成不良影响。比如由于回答MC题并不是真实的语言使用活动,热衷于做MC题,放弃采用各种反映现实生活中真实语言交际活动的、激发学生运用语言达到交际目的的交际任务,不利于提高学生的语言交际能力。同时,由于MC题型无法直接测量语言表达能力,只能用于词汇、句法、听力和阅读考试,只做MC题势必造成学生语言接受能力较高、而语言表达能力低下的情况。而且师生在大量操练MC题时,必然会将部分注意力集中在对付MC题型的技巧上,而忽视语言学习这一根本目的。这就使测试内容与测试目的和学习目的之间的相关性大大减少。
2.4 MC题型的预测效度
MC题型的预测效度比较差。预测效度指该测试对考生未来语言表现的预测度。然而,上述分析明确地指出,MC题型测试的只能是学生的语言知识,甚至只是语言知识中的某个部分,如语法、词汇或是听力。很多语言学家和测试专家强调虽然语言语法知识是整个语言能力中不可或缺的一部分,但是语言知识并不等于实际的语言交流能力。对于语言知识的测试无法去预测学习者在真实的语言环境中是否具有整和这些独立的语言元素,从而创造性地进行语言交流。因此,运用MC题型来预测考生的语言能力,它的预测效度是极低的。
2.5 MC题型效度的干扰因素
MC题型有利于受试猜测答题。单纯凭猜测答对一道四个选择项的MC试题的概率是25%;如果受试凭借自己所掌握的不全面的语言知识进行猜测,则答对概率相对小得多。此外,MC题型的答题过程受到猜测和作弊因素的干扰,也降低了其整体的效度。当然,在重大的考试中,常常通过采用A/B卷,不同的答题卡等手段来降低这方面的影响,确保整个测试的效度。
同时,MC试题的干扰项设计方面也可能存在着问题。如考点不明确。一般语法/词汇题要求每题只涉及一个考点,或最多两个能互相增补的考点,在不可避免地涉及多个考点因素的情况下,必须对一些不相关的、互相抵消干扰作用的选项加以严格控制。当选项之间的区别对试题的答对与否毫无影响时,这种选项就是多余的,不能有效地起测试作用;或者干扰项本身有错误,缺乏有效性。有些干扰项放入题干,与其它选项相比较处于很低的语言层次,在语法结构、词汇意义、词汇搭配方面不符合答案的基本要求,与题干明显不相容,因而缺乏干扰作用。
2.6测试效度与测试目的
综上所述,多项选择题的整体效度有很大的局限性。虽然它无法有效地评价也无法预测学习者的真实的语言运用能力,但是它在语言语法知识的测试中还是被普遍采用的。对于其效度的评价,应该结合测试本身的目的和内容。首先,在水平测试中,基于单一、孤立语法知识的多项选择题,其结构效度和预测效度几乎无效。所以,在新型的大学英语四、六级考试,和国际的TOFEL和IELTS考试中,这样的多项选择题已经淘汰。但是对于基于课本的成绩测试,或者是期初或期末的诊断性测试,其重点是学生对于一定的词汇,句型的理解和掌握。很明显作为传统的语法测试手段的多项选择题的效度还是很强的。这些测试的目的是对学生的当时语言知识的评价,并且无需根据该成绩做出任何预测,所以MC题型极低的预测效度可以不加考虑。此外,虽然广大语言学家和教育者强调对综合语言能力的培养和测试,但是语言知识始终是整个语言能力中不可或缺的基础能力之一。特别是对于一些语言水平较低的学生来说,夯实语言基础知识仍是必需的。所以不能因为MC题型在评价语言能力上的不足,而忽视它在语法测试中的高效度。因此,在基于语言知识的成绩和诊断测试中,MC题型应当充分被利用。
3.如何提高效度
由于各种效度的差异,要想提高MC题型的整体效度,既要分析具体考试性质根据每个具体考试的使用目的、主办方式、对象范围、实施频度、对受试命运的决定性作用、对教学的反拨作用,又要权衡考虑信度和效度,决定是否使用MC题型。例如,学校范围的甄别测试,目的是鉴定学生个人各种能力之间的强弱,指出努力方向,供今后教学、学习参考,而不在于区分学生之间的差别。考试由学校组织,受试人数有限,对受试的命运没有决定性影响,但是对教学的反拨效应很显著,所以信度并不重要,效度却很关键,可以采用比MC题型更直接的、效度更高的讲话、写作或多技能运用的表达性题型。
在决定使用MC题型后,应在维持高信度的基础上,从确定与之相结合的题型、确立选材原则、写题原则、写题技巧和评分原则等各个环节入手,积极探索提高其效度的办法。另外,在听力、阅读测试命题中,可以发掘、利用一些非常适合于改编成MC试题的、现实生活中的真实交际活动。例如,利用两个人就报纸上招聘信息专栏列有的几条信息进行的对话可以制作一道听力试题,请受试在听过该对话后判断这两人各自中意的是专栏中的哪个工作。
语言考试能否取得预期效果,首先取决于命题是否成功。命题质量是保证MC题型应有的信度和效度的前提。MC题型的命题必须严格遵守各环节的命题原则,对任何环节都不能疏忽大意,否则会产生不良试题,降低该题型应有的信度和效度。MC题型与其它题型一样,需经过“编写—审题—预测—修改”这样一个过程,在编写题干、正确答案和干扰项时,应明确规定题意,措辞简洁、准确,提高内容效度。
4.结语
从以上的分析可看出,MC题型的各种效度中有较高的表面效度,也有较差的内容和结构效度。正是效度表现的差异性使得其有其它题无法替代的优势,同时也存在着许多弊端。因此,在测试中要尽量扬长避短,从而保证测试的效度,达到既检验教学效果,又促进教学质量提高的目的。
参考文献:
[1]刘润清.语言测试和它的方法[M].外语教学与研究出版社,2001.
[2]潘之欣.语言测试中的多项选择题型[J].外语界,2001,(3):67-74.
关键词: 英语测试 多项选择题 效度
随着我国英语教学事业的蓬勃发展,英语测试显得日益重要。根据教育测试学理论,测试在教育中占据重要位置。教学通过测试来检验其效果,进行教学评估;而测试又会对教学产生有利或有害的反拨作用(washback effect)。因此,要充分发挥测试对教学的正面影响,提高测试效度就成为关键问题之一。而在语言测试中,多项选择题,简称MC题型,是近几十年来使用最广泛的题型,尤其在一些大规模考试中,如高考,大学英语四、六级考试,研究生入学考试,出国人员外语水平考试,等等。多项选择题不仅成为决定外语测试有效性的关键因素,而且对教师的教学和学生的学习方法与态度产生了不容忽视的影响。本文旨在对多项选择题的效度进行分析,探究提高其效度的方法。
1.理论基础
多项选择题是典型的心理—结构测试阶段的测试手段。它最初创立于心理测试。上世纪二十年代初,以多项选择题型和是非题型为代表的客观测试开始在美国教育界包括语言学科中使用,并迅速获得承认;三十年代,心理计量学的发展进一步促进了客观测试手段的应用;到五十年代,客观语言测试已经在美国教育性语言测试中占主导地位;在六十年代许多结构主义语言学家和教育心理学家开始研究语言测试问题,并用测量学的方法计算测试的信度和效度。他们非常注重客观性测试,随着交际测试的倔起,八九十年代多项选择题在交际测试中渐成主流。
一道多项选择题通常由题干和3—5个选择项组成。选择项通常包括一个答案项(或称正确选择项),以及若干个干扰项。这种类型试题称为填空性多项选择题。一种常见类型为取代性多项选择题,通常用于测试考生的词汇和结构知识。命题者给出一个完整的句子作为题干,把其中要考的词用下划线标出,要求考生从所给的选择项中选取可以放到句子中取代下划线部分的答案项。
2.效度
效度通常是指测试的恰当性或者测试的任何组成部分发挥出其测量的作用。有效的测试应该能够测试出其应该测试的东西。测试有各种作用与目的。错误使用效度,测试在某些时候是有效的而在某些时候却是失效的。效度一般分为五种:表面效度、结构效度、内容效度、共时效度和预测效度。结构效度也称观念效度或理论基础效度,是指测试是否以有效的语言观和语言学习观为理论根据。观念效度是语言测试的主要效度,是一切其它效度的基础,与观念效度密切相关的是内容效度。内容效度是指测试的内容中两种相互关联的性质,即测试内容与测试之间的相关性;测试内容与测试的目的及与学习目的之间的相关性。观念效度和内容效度属语言测试的内在效度。共时效度和预示效度属外在效度,它们指测试结果在多大程度上与一些外在标准相关,故又称标准参照效度。表面效度是指测试从外观看上去被人接受的程度,即看上去是否考了它应该考的。因而具有表面效度的测试容易引起应试者的兴趣。
2.1 MC题型的表面效度
表面效度强调的是测试对于测试者是否呈现出它所要测试的内容。MC试题采取一题一考点的方式,每道题只测试一个语言点,非常有针对性。教师可以及时准确地了解学生的掌握情况和教师的教学效果,测试的表面效度较高。考生在回答MC试题时,只需在答卷上书写符号或在答题卡上涂黑相应圆圈,比自行书写答案耗费的时间要少很多。所以在相同的时间限制内,MC试题可以测试更多数量的试题,可以覆盖更多的语言点,如语音、词汇、语法、阅读理解和完形填空等,测试抽样量较大,测试内容覆盖面较广,意味着测试的覆盖面较全,即考试结果的可靠性和稳定性相对较高。MC试题编排上可视测试需要而定,少则几十题,多则上百题,使试卷有较大覆盖面,从多方面测试受试者水平。根据测试的不同需要,还可降低或增加测试难度。比如选择项数量可三选一或五选一不等,还可与其它题型构成混合题型。MC试题在拼几道平行卷时也比较方便,换一换题干或选项顺序,或删改个别干扰项就可迅速完成任务,测试手段比较灵活。因此,MC试题的表面效度相对较高。
2.2 MC题型的结构效度
结构效度是整个效度中最基础、最重要的要素。甚至,有时候用来代替效度本身。结构效度主要包括考生所掌握的各种语言能力和语言知识,例如写作能力,口语的流利性,或者是对语法知识的掌握,等等。而这些知识和能力就成为语言测试测试的内容和对象。根据对MC试题的理论基础的分析,如果MC试题定位的结构效度,是语言知识,该测试手段在这样的语法测试中具有高度的结构效度。这也是,为何多项选择题在心理—结构测试阶段十分盛行,并至今仍被广泛采用的原因。
并且随着语言学的发展和各种语言学派的交流融合,MC试题的结构效度的局限性就日益暴露出来。分离式的测试将语言分割成孤立的元素,那么语言的综合能力就无法在这种试题中体现出来。同时由于语言的社会性,语言使用者的心理,认知等因素也被考虑到实际的语言使用中,很明显,对于语言能力的定义早突破了传统的语法知识。由此可见,MC试题的结构效度几乎为因为它已经和多项选择题的理论基础相背离了。它的设计和解答都和实际的语言使用相距甚远。MC试题虽然能够成功地测得考生对语言知识的辨认能力,但较难测出考生运用语言知识的实际能力。如在以MC试题出现的结构和书面表达部分能拿高分的考生,并不一定表明其能够自如运用这些语法结构知识进行书面或口头交际。甚至有少数语法部分得高分的考生,耳不能听,口不会说。这就给MC试题的结构效度打了折扣。经过多年研究,一些测试专家指出,多项选择题只能测试考生的语言输入能力,如听和读,但不能测试考生的语言输出能力,如说和写。因此,MC试题的结构效度在当前的测试理论之下的局限性突出。
2.3 MC题型的内容效度
内容效度强调的是测试内容与测试之间的相关性,测试内容与测试目的及学习目的之间的相关性。一个对学生至关重要的考试若单纯采用MC题型,则很可能对语言学习和教学产生负面影响。MC题型成为使用最普遍的测试手段的主要原因在于它较高的表面效度和信度。但是,MC题型并不是有效的教学手段,在教学中大量操练MC题将对教学造成不良影响。比如由于回答MC题并不是真实的语言使用活动,热衷于做MC题,放弃采用各种反映现实生活中真实语言交际活动的、激发学生运用语言达到交际目的的交际任务,不利于提高学生的语言交际能力。同时,由于MC题型无法直接测量语言表达能力,只能用于词汇、句法、听力和阅读考试,只做MC题势必造成学生语言接受能力较高、而语言表达能力低下的情况。而且师生在大量操练MC题时,必然会将部分注意力集中在对付MC题型的技巧上,而忽视语言学习这一根本目的。这就使测试内容与测试目的和学习目的之间的相关性大大减少。
2.4 MC题型的预测效度
MC题型的预测效度比较差。预测效度指该测试对考生未来语言表现的预测度。然而,上述分析明确地指出,MC题型测试的只能是学生的语言知识,甚至只是语言知识中的某个部分,如语法、词汇或是听力。很多语言学家和测试专家强调虽然语言语法知识是整个语言能力中不可或缺的一部分,但是语言知识并不等于实际的语言交流能力。对于语言知识的测试无法去预测学习者在真实的语言环境中是否具有整和这些独立的语言元素,从而创造性地进行语言交流。因此,运用MC题型来预测考生的语言能力,它的预测效度是极低的。
2.5 MC题型效度的干扰因素
MC题型有利于受试猜测答题。单纯凭猜测答对一道四个选择项的MC试题的概率是25%;如果受试凭借自己所掌握的不全面的语言知识进行猜测,则答对概率相对小得多。此外,MC题型的答题过程受到猜测和作弊因素的干扰,也降低了其整体的效度。当然,在重大的考试中,常常通过采用A/B卷,不同的答题卡等手段来降低这方面的影响,确保整个测试的效度。
同时,MC试题的干扰项设计方面也可能存在着问题。如考点不明确。一般语法/词汇题要求每题只涉及一个考点,或最多两个能互相增补的考点,在不可避免地涉及多个考点因素的情况下,必须对一些不相关的、互相抵消干扰作用的选项加以严格控制。当选项之间的区别对试题的答对与否毫无影响时,这种选项就是多余的,不能有效地起测试作用;或者干扰项本身有错误,缺乏有效性。有些干扰项放入题干,与其它选项相比较处于很低的语言层次,在语法结构、词汇意义、词汇搭配方面不符合答案的基本要求,与题干明显不相容,因而缺乏干扰作用。
2.6测试效度与测试目的
综上所述,多项选择题的整体效度有很大的局限性。虽然它无法有效地评价也无法预测学习者的真实的语言运用能力,但是它在语言语法知识的测试中还是被普遍采用的。对于其效度的评价,应该结合测试本身的目的和内容。首先,在水平测试中,基于单一、孤立语法知识的多项选择题,其结构效度和预测效度几乎无效。所以,在新型的大学英语四、六级考试,和国际的TOFEL和IELTS考试中,这样的多项选择题已经淘汰。但是对于基于课本的成绩测试,或者是期初或期末的诊断性测试,其重点是学生对于一定的词汇,句型的理解和掌握。很明显作为传统的语法测试手段的多项选择题的效度还是很强的。这些测试的目的是对学生的当时语言知识的评价,并且无需根据该成绩做出任何预测,所以MC题型极低的预测效度可以不加考虑。此外,虽然广大语言学家和教育者强调对综合语言能力的培养和测试,但是语言知识始终是整个语言能力中不可或缺的基础能力之一。特别是对于一些语言水平较低的学生来说,夯实语言基础知识仍是必需的。所以不能因为MC题型在评价语言能力上的不足,而忽视它在语法测试中的高效度。因此,在基于语言知识的成绩和诊断测试中,MC题型应当充分被利用。
3.如何提高效度
由于各种效度的差异,要想提高MC题型的整体效度,既要分析具体考试性质根据每个具体考试的使用目的、主办方式、对象范围、实施频度、对受试命运的决定性作用、对教学的反拨作用,又要权衡考虑信度和效度,决定是否使用MC题型。例如,学校范围的甄别测试,目的是鉴定学生个人各种能力之间的强弱,指出努力方向,供今后教学、学习参考,而不在于区分学生之间的差别。考试由学校组织,受试人数有限,对受试的命运没有决定性影响,但是对教学的反拨效应很显著,所以信度并不重要,效度却很关键,可以采用比MC题型更直接的、效度更高的讲话、写作或多技能运用的表达性题型。
在决定使用MC题型后,应在维持高信度的基础上,从确定与之相结合的题型、确立选材原则、写题原则、写题技巧和评分原则等各个环节入手,积极探索提高其效度的办法。另外,在听力、阅读测试命题中,可以发掘、利用一些非常适合于改编成MC试题的、现实生活中的真实交际活动。例如,利用两个人就报纸上招聘信息专栏列有的几条信息进行的对话可以制作一道听力试题,请受试在听过该对话后判断这两人各自中意的是专栏中的哪个工作。
语言考试能否取得预期效果,首先取决于命题是否成功。命题质量是保证MC题型应有的信度和效度的前提。MC题型的命题必须严格遵守各环节的命题原则,对任何环节都不能疏忽大意,否则会产生不良试题,降低该题型应有的信度和效度。MC题型与其它题型一样,需经过“编写—审题—预测—修改”这样一个过程,在编写题干、正确答案和干扰项时,应明确规定题意,措辞简洁、准确,提高内容效度。
4.结语
从以上的分析可看出,MC题型的各种效度中有较高的表面效度,也有较差的内容和结构效度。正是效度表现的差异性使得其有其它题无法替代的优势,同时也存在着许多弊端。因此,在测试中要尽量扬长避短,从而保证测试的效度,达到既检验教学效果,又促进教学质量提高的目的。
参考文献:
[1]刘润清.语言测试和它的方法[M].外语教学与研究出版社,2001.
[2]潘之欣.语言测试中的多项选择题型[J].外语界,2001,(3):67-74.