认知诊断框架下多级评分项目的DIF及其检测方法的研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:qh12121312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在心理与教育测量的舞台上,多级计分的题目一直在其中扮演着非常重要的角色。相较于0-1计分的题目而言,多级计分的题目能够提供给施测者更为丰富的信息。因此,多级计分题目的测验公平性也一直受到大家的关注。然而,在认知诊断的背景下,对项目功能差异的研究目前都是基于0-1计分项目开展的。因此,本研究的主要目的是将几种常见的多级计分DIF检验方法引入到多级计分认知诊断中,以填补该领域的空白。本研究主要分为三个部分:研究一是根据多级计分DIF的概念以及认知诊断的特点,对多级计分认知诊断领域的DIF进行界定以及多级计分认知诊断DIF检验方法拓展。研究二通过模拟实验探讨在几种常见的缩减模型下,the mantel test、LDFA、LR检验以及Wald检验法在不同的实验条件下对一致性DIF检验的表现。研究三主要为通过模拟实验探讨在饱和模型seq-GDINA下,几种方法的在不同的实验条件下对一致性DIF的检验表现。除了模型上的差异,模拟实验中自变量还包括DIF大小、每组人数、DIF试题比例、DIF类型。研究结果表明:1)不论是在缩减模型还是饱和模型下,各方法均能对多级计分认知诊断中的一致性DIF进行有效的检验,且各方法的表现受模型的影响不大。2)以KS为匹配变量的LDFA方法和the mantel test对一致性DIF的统计检验力在所有方法中最高。3)两种基于模型的DIF检验方法:Wald检验和LR检验对I类错误的控制要优于两种不基于模型的DIF检验方法:LDFA方法和the mantel test方法。且在所有方法中,Wald检验对I类错误的控制最好。4)对于LDFA和the mantel test方法而言都有着两种匹配方式,在这两种匹配方式中,以KS为匹配变量时两种方法对一致性DIF的统计检验力都要比以总分为匹配变量时两种方法的统计检验力更高,且在I类错误上,以KS为匹配变量比以总分为匹配变量时I类错误率更低。5)在其他几种实验条件中,DIF量对各方法的表现影响最大,其次是组人数的大小,最后是DIF的题目比例。从方法的角度来讲,以总分为匹配变量的the mantel test方法和LDFA方法受实验条件的变化的影响最大,其余方法受实验条件变化的影响较小。
其他文献
本论文的大体方向是对工笔人物画审美性的探讨与研究,这是一次探讨性的写作过程,在研究中重点体现了三个方面的内容。首先将论文研究时间范围划分到20世纪50年代至今,是因为
目的观察局部针刺结合言语康复训练治疗缺血性脑卒中后痉挛型构音障碍的临床疗效。方法选取72例缺血性脑卒中后痉挛型构音障碍患者,随机分为治疗组和对照组,每组各36例。两组患者均给予缺血性脑卒中后常规治疗。对照组采用言语康复训练的方法进行治疗,治疗组采用针刺结合言语康复训练的方法进行治疗,共治疗4周,分别对其临床疗效及治疗前、后改良的Frenchary构音障碍评级量表总得分、各分项得分进行研究,并用统计
目的:探讨倍他乐克治疗扩张型心肌病的临床效果。方法:选择60例扩张型心肌病患者作为观察对象,将其随机分为观察组和对照组。观察组30例,在常规抗心力衰竭的基础上运用倍他乐
给出了一种在可编程片上系统(System on programmable chip,SOPC)中实现JPEG解码的IP核设计方案,将JPEG解码算法中大量的运算采用硬件实现,嵌入式处理器只参与很少的一部分工作,从
云河取水枢纽以上控制流域面积为7 531 km2,年来水量可以满足云河灌区3 000hm2灌溉农田的要求,但是云河的河道水位较低,常年水位仅在35.5~36.5 m之间,而灌区所处的地面高程较
Earl Sasser教授发现一个与高利润和快速增长更密切相关的因素——顾客信任,打破了视市场占有率为第一要素的传统看法。一些先知先觉的管理者也意识到这一点,美国维持化学品公
目的:探讨多发性骨髓瘤患者医院感染的临床特点及危险因素.方法:对2009年10月-2013年2月收治的328例多发性骨髓瘤患者医院感染的临床资料进行回顾性分析.结果:328例患者中152例
结合2010年全国烟草专卖局局长姜成康在公司总经理座谈会上的讲话和"卷烟上水平"基本方针和战略任务,本文以"卷烟上水平"五个主要"目标和任务"中的"市场营销上水平"为重点,阐