标准参照测验决策一致性指标估计方法的比较研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:feijian06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标准参照测验的一个重要功能是将考生进行分类,判断考生是否达到了某一个标准或处于某个水平。决策一致性指考生在两次平行测验中被一致归类的程度,是衡量标准参照测验质量的重要指标。由于考生在两次测验上的表现难以获得,研究者基于测量模型,提出了数十种通过单次施测估计决策一致性指标的方法。为了检验新提出的基于项目反应理论(IRT)模型的估计方法是否优于传统的基于经典测量理论(CTT)模型的方法,本研究采用模拟数据和实证数据,比较了基于IRT模型的P方法及D方法与基于CTT模型的LL方法和复合多项模型方法。   在模拟研究中,通过模拟生成了三种测验长度(20+2,40+3,60+5)的复杂计分测验,分界分数设定为单分界分数(35%,60%,85%)或三分界分数(三个单分界分数同时应用),在12种测验情境中分别用四种方法估计测验的决策一致性,并以偏差和均方根误差(RMSE)值作为衡量其估计准确性的指标。在实证研究中,采用某次全国性小学数学水平考试的数据,对四种方法模型与数据的拟合程度和估计值的大小进行了比较。结果发现,基于IRT模型的方法能够得到决策一致性指标更准确的估计值,但估计值的标准差较大。此外,测验长度、分界分数个数和分界分数位置也对估计结果产生了影响。测验长度越长,决策一致性的估计值越大,估计的准确性越高;分界分数个数增加,决策一致性的估计值则降低;当分界分数靠近考生分数分布的平均数时,决策一致性的估计值变小,估计的准确性也降低。相比基于CTT模型的方法,基于IRT模型的方法估计决策一致性的准确性受测验情境的影响较小。此外,CTT模型和IRT模型都能较好的拟合实际数据,CTT模型对于实证数据的拟合更好,而基于IRT模型的方法能够获得更高的决策一致性估计值。
其他文献
学位
江光荣(2005)提出会谈深度三维模型(情感,此时此刻,个人性)。朱旭等(2006)和胡姝婧等(2008)先后对三维模型进行检验,结果表明三维模型在一定程度上具有合理性。本研究目的之
传统经济学一个经典假设是“理性经济人”假设,该假设认为人在经济活动中的决策是基于经济利益或者说是为了使自我的利益最大化。然而,近年来研究者应用最后通牒博弈范式通过实
自我关注是临床和非临床人群中重要的认知过程,指对与自我相关的、内部生成信息的知觉,不同于通过感官获得的对外部生成信息的知觉。它被很多研究证实是引起和维持社交焦虑症状
目的为了有效控制茂名市首次在由马来西亚返乡祭祖的华侨中发现2例输入性基孔肯雅疫情,防止我市出现输入性新发传染病。方法按《基孔肯雅热预防控制技术指南》[1]预防控制措
目的:本研究旨在了解玉树地震创伤对幸存者的PTSD症状的影响,并研究玉树当地的宗教文化背景以及幸存者知觉到的社会支持在其中发挥的作用。   方法:采用问卷测量的方法,在玉树
期刊
情绪弹性是心理弹性的一个分支,指的是个体能够产生积极情绪以及个体能迅速从消极情绪中恢复过来的能力。情绪弹性是个体在日常生活中所具有的一种情绪能力,对个体快速适应外界
胡锦涛总书记在中央纪委第七次全会上发表重要讲话,深刻阐述了新形势下全面加强领导干部作风建设的极端重要性和紧迫性,强调要大力倡导八个方面的良好风气。总书记的讲话对于
期刊