论文部分内容阅读
测试方法特点对评分标准的内容和最后的分数有潜在的影响。实验证明我们在测量语言能力时所运用的测量方法影响语言测试中被测试者的行为表现(Bachman & Palmer, 1981, 1982; Brutsch, 1979; Clifford, 1978, 1981;Shohamy, 1983, 1984)。但是测试方法并不是单一的因素。任何方法都可能包含许多特点或层面。每一种特点或层面都会对分数产生影响。Bachman(1990)对此做了最为全面的讨论和论述(Bachman & Palmer, 1996)。他论述了测试环境、任务要求、评分方法、评分标准以及测试动机等变量,而这些变量都可能会影响到学生或考生的表现或分数。典型的行为测试要求评分人员依据一定的评分标准判断考生的书面语或口语。考生书面语的分数可能会受到评分标准具体的制定过程中所内在的一些变量(Turner and Upshur,2002)。分数也可能会受评分方法中的一些变量影响。本文对实证法制定评分标准中的三个变量进行了研究:评分标准制定人员及其制定标准所使用的作文样本和评分方法。这三个变量都可能影响评分标准的内容、结构以及作文的最后得分。 本研究所采用的150份作文样本取自在中国山西省举办的一次全国写作竞赛。所有参赛者均为大学生。参赛作文被送往山西大学外语学院,该学院采用一定的评分方法和标准对这些作文进行了评分。从这些参赛作文中抽样选取的150份样本打印好之后根据该学院给分情况分为三小组。其中两小组作文均作为实证制定评分标准的样本。第三小组作文备为评分之用。本研究中的标准制定人员和评分人员来自山西大学外语学院的8名硕士研究生和3位教师。所有人员都是非母语英语学习者并且在外语教学方面富有经验。 本研究使用多元回归法考察 1)根据两组外语学习者的作文样本所得的评分标准的制定和使用情况;2)在外语学习中使用不同的学生作文样本制定评分标准是否会产生不同的评分细则;3)根据同一或不同样本实证制定出的整体性标准和分析性标准对学生作文分数的影响程度。 本研究的目的是要对在外语学习研究领域中制定实证型的评分标准以及评分方法中的变量进行分析。本文作者希望本研究将会对实证制定评分标准相关方面问题的进一步研究提供帮助并对中国的外语学习领域研究规划和决策过程有所裨益。