论文部分内容阅读
当今,传统测验越来越不能满足社会的需求,因为它只能提供给被试一个笼统的分数或能力,对于考生具体的知识状态无法获知。与传统测验相比,认知诊断测验的优势就在于它能够揭示每个被试的具体认知状况,并且有效地、有针对性地对个体进行补救。特别是在教育过程中,教师和学生都希望更多地了解学生所掌握的知识、形成的技能和策略等信息,从而能够促进教与学。Tatsuoka的规则空间模型(RSM)是较早提出且最有影响的认知诊断模型之一,她认为测验评估能够且应该提供被试的具体认知结构,并且用它来指导对被试作出补救决策。属性层次方法(AHM)是规则空间模型的一种变体,该方法假设测验项目是由一组具有层次结构的属性来表征的,然后根据被试的作答反应把被试归类到相应的知识状态中。本研究,认知诊断模型选用的是AHM。
目前为止,多级评分的认知诊断还停留在认知属性等权重的阶段,但是一属性一分的评分方法与属性可能具有不等权重的实际情况不相符合,对于两被试掌握某项目中相同个数的属性,而非相同的属性,理应给掌握难度更大的属性的被试更多的分,而不是相同的分数。文中提出一个属性分数权重的计算方法即将贝叶斯网与最小二乘方法相结合,发现并解决了属性在不同的项目内权重可能不相等的问题。本研究进一步将认知诊断推广到多级评分的情形。试验证明,属性不等权重的等级反应模型的AHM具有较高的判准率。
用蒙特卡洛方法模拟实验,观察属性不等权重的等级反应模型的AHM的模型表现。选用三种分类方法即A、B、LL方法,两个归准率的评价指标即属性模式归准率和属性平均归准率。从试验结果可以发现,在属性带有不同权重的条件下,多级评分模型的三种分类方法(A、B、LL方法)在四种slip的情况下(5%、10%、15%、20%)都保持了非常高的判准率。尤其是A、B方法,属性模式判准率甚至在slip为20%的情况下判准率都在90%以上。
试验结果显示属性不等权重的等级反应模型的AHM具有较高的判准率。另外,在测试项目开发阶段,属性分数权重对项目属性评分也有很好的指导作用。