论文部分内容阅读
目的:项目反应理论下的测验信度(以下简称IRT信度),能够评价潜在特质估计的可靠性、稳定性,是测验分数精度和稳定性的宏观指标。本文旨在探讨在不同模型-数据资料拟合条件下,选择何种方法对IRT信度进行估计。方法:本研究以模型-数据资料拟合度以及信度估计方法为自变量,研究其对于估计准确度的主效应及交互效应,能够为不同模型-数据资料拟合度水平下IRT信度估计方法的选择提供参考。本研究采用R软件及其指令包编写计算机模拟程序,采用3*5的两因素混合实验设计,其中模型-数据资料拟合度为被试间变量(“高度拟合”、“中度拟合”和“低度拟合”三种水平模拟数据),IRT信度估计方法为被试内变量(总体信度、边际信度、理论信度、经验信度、Nicewander信度三种水平),以信度估计值的绝对偏差(信度估计值与信度真值之差)为因变量IRT信度估计值偏差的指标。结果:不同IRT信度估计方法对IRT信度影响显著,估计偏差最小的是边际信度,估计偏差最大的是Nicewander信度;不同模型-数据资料拟合度差异,模型-数据资料拟合度越低,IRT信度估计偏差越大;信度估计方法与模型-数据资料拟合度交互效应显著,边际信度的估计绝对偏差最不易受到模型-数据资料拟合度影响,表现得最为稳定,经验信度稍次;在“高度拟合”水平下,总体信度估计偏差最小;在“中度拟合”和“低度拟合”水平下,边际信度估计偏差最小;Nicewander信度在模型-数据资料拟合度的各水平均是估计偏差最大的。结论:需要根据模型-数据资料拟合度选择适当的IRT信度估计方法。在拟合度较为理想时,用总体信度是最优选择;拟合度一般,边际信度是最佳选择;更差的拟合条件下边际信度依然是最佳选择。而当无法预知拟合度的时候,边际信度首选,其次就是经验信度。