论文部分内容阅读
在语言测试领域,有大量关于整体性和分析性评分量表在做事测试中的争论的研究,尤其是在写作和口语表达的测试中。然而,同样的研究在言语行为测评当中却鲜有发现。为此,本研究尝试用实证的方法去探索在两种评分量表用于言语行为测试中,同样的评分员在评分过程中有什么差异。在本研究中,两位大学教师(男女各一名)被邀请评阅试卷。受试者是三十位(男13,女17)年龄跨度从19到22的大学生,试卷的形式是WDCT。 在本研究中数据从两个互补的方面来处理。定性研究主要是分析两个问卷调查的结果,问卷调查的目的是引出评分员对两种评分量表的态度,对评分员培训的认识以及量表使用偏爱。统计(SPSS软件)和FACETS分析能够呈现出等距量表中评分员的严厉度估计以及拟合度,同时通过这些软件的分析,可以调查评分员的信度的严厉度。定性和定量的分析结果可以得出如下的结果:首先,两种评分量表都是可信的,而且得出有信度的评分结果。其中分析性评分要比整体性稍微信度高一点。其次,在严厉度方面,分析性评分的严厉度不同估计更加明显,虽然从整体上来说,评分员在两种评分量表的使用上,严厉度方面呈现出一致和有意义的差异。最后,评分员在请求言语行为的四个评价特征上呈现出偏差,其中最容易得高分的一项是言语行为,最难得分的是信息量和语体得当。评分员对于评分方法的评价都集中于整体性评分方法。 基于所收集的数据以及之前的研究可以看出,如果受试者的分享能力信息不在需求范围,整体性评分方法比较适合于这种做事项目的评价。同时,本研究对语用能力的教学及其测试的开发都有一定的意义。