论文部分内容阅读
测验等值是对测量相同的心理品质的不同测验形式之间建立起连接的过程,这一过程是为了使测量同一种心理品质的不同测验形式之间的分数可以互相比较。锚测验非等组设计在等值设计中是最为灵活的等值设计。普遍都认为在测验等值中锚测验应是全测验的一个平行缩减版(minitest),具体地说,锚测验应与全测验在内容和统计特征上具有良好的代表性。目前,在使用非等组锚测验设计时,锚测验一般采用为全测验的一个平行缩减版(minitest)以确保其具有统计代表性。Sinharay和Holland(2006)提出了一个极富挑战性的观点,他们认为可以放宽对锚测验难度参数统计特性的要求。本论文则验证这一信念是否正确。本研究使用R-2.15.2统计软件模拟研究锚测验难度参数方差特征对测验等值误差的影响。在三种等值方法(链百分位等值、Levine法和Tucker法)和锚测验非等组设计两种条件下,探讨了锚测验不同类型的难度方差对测验等值误差的影响。结果显示,当锚测验难度方差小于全测验难度方差时和当锚测验方差与全测验一致时(即当锚测验为全测验的平行缩减版时),等值的随机误差和系统误差表现一样的好。因此,对于锚测验要求与全测验具有相同的统计规格可能过于严格。而且,平行缩减版(minitest)需要包括非常难和非常容易的项目以确保项目难度的分散性,而这些项目经常是很少的。如果放松对锚测验项目难度方差的要求进行锚测验等值时操作将会更加简便。