基于规则空间模型对非共同总体下无锚题测验等值的研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:yudsly2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
测验等值的主要目的是使得作答不同测验或题本的受测者所获得的成绩是可以比较的。由于许多测验是高利害的,测验等值也就尤为重要,因而也是测验实践领域重要的研究领域之一。   测验等值一般要求两个测验具有相同的测量结构、相同的信度以及等值函数的对称性等要求。但是在以往的等值中,测验结构相等的证明并没有得到有效的解决,这给测验等值的滥用提供了可能。此外,等值常用的设计是锚题-非等组设计,其等值方法的精度主要依靠锚题的性质。若锚题质量无法得到保证,或者锚题无法收集,则测验等值也就遇到了困难。   规则空间模型作为在项目反应理论(IRT)和统计分类基础上建立起来的认知诊断模型,其核心Q矩阵理论为解决测验等值中所遇到的两个问题提供了解决的方案。一方面,通过Q矩阵可以导出表示测量结构的A矩阵,为证明两个测验结构相等提供了形式化的表达;另一方面,通过Q矩阵获得的作答测验的理想受测者也为无锚题的测验等值提供了可能。   本研究采用模拟数据和实证数据相结合的方法,比较了通过规则空间模型生成共同组的两种等值方法(MS和同时估计方法)与传统锚题-非等组设计下的五种等值方法(MS、MM、Heabara、Stocking&Lord和同时估计方法)。并将测验结构和受测者的作答失误/猜测率也纳入自变量,用Bootstrap方法考察其多次等值的稳定性,得到的结果如下:   共同组设计下的CGMS方法较其他等值方法在不同条件下均具有最好的等值稳定性,而共同组设计下的同时估计方法较其他等值方法并未有较好的稳定性;随着受测者作答失误率的上升,各种等值方法的等值稳定性均有所下降;不同测验结构下等值的稳定性不同,表现为收敛型和直线型最优,而发散型和无结构型较差。
其他文献
“别讲历史了吧,耳朵都快磨出茧了。”曾经与奔驰宝马平起平坐,然后受经济影响破产,现在载着德国众多先进技术和零部件供应商又卷土重来,重振雄风。似乎每个宝沃试车报告的开头都是这样得瑟的,在宝沃BX7的名声与销量趋于稳定后,第二款紧凑型SUV——宝沃BX5也于2017年3月末在国内上市销售。以15.98万-21.98万元的售价开启了宝沃汽车更加亲民的品质化路线。  不走寻常路的人反而更容易成功,不知从何
期刊
兰科苞舌兰属(Spathoglottis)植物,假鳞茎扁球形,被革质鳞片状鞘,顶生1~3叶。叶披针形,长达43 cm,宽1~2.5 cm,两面无毛。花葶长达50 cm,被密柔毛,下部具数枚紧抱于花序柄的筒
中国保险行业协会与中国汽车维修行业协会(以下简称“两协会”)自2014年4月起开展国内市场常见车型零整比系数研究,向社会公布了74款车型的整车零整比,反映了汽车使用过程中
雨花石为我国特有的美石。雨花石形成于距今250万年至150万年,是天然的玛瑙石、蛋白石、水晶石玉髓、燧石等卵石的总称。由于雨花石绚丽多彩、温润斑斓,历来受到文人雅士的喜
探究性学习是国内基础教育改革的一项重大举措。它可以激发学生学习兴趣,培养科学研究精神和创新能力。《基础教育课程改革纲要》和《国家中长期教育改革和发展规划纲要》中
信息技术的迅猛发展,直接对人们的认知方式产生深远影响。依托网络学习平台的强大支撑,全新的学习方式应运而生。然而,任何网络学习平台的有效应用均离不开优质的资源,如何充
当选择以清新、健康的静态方式展示一款高性能车时,其强大的性能很容易被下定论.就像是在选择一款能够带你登上斯诺登峰的登山靴时,你不会考虑在米兰时装周T台上出现的鞋一样
期刊
通过分析VRLA蓄电池运行失效的原因和使用过程中所关心的问题,研究了电池运行监测管理系统(BMS)应解决的关键问题,主要包括:(1)监测管理系统的合理结构;(2)电池组及电池单体
本研究之目的在于了解教育专业硕士研究生的学位论文体验,并探讨这一体验如何形成。研究以四位来自教育专业不同方向的女研究生为研究对象,采用质性方法,主要以深度访谈的方
近年来,随着高等教育扩招等原因,每年毕业的大学生人数都在增长,随之毕业时无法落实工作的学生人数大量增加,并且在人才使用过程中岗位与人才不匹配,造成人才闲置、高才低用