论文部分内容阅读
在项目反应理论(IRT)中,当测量被试的潜在能力时,选择一个合适的项目反应模型是极重要的,逻辑斯蒂克(Logistic)模型因其特有优势得到了广泛应用。由于单参数、双参数和三参数Logistic(1PL,2PL和3PL)模型是嵌套的模型,所以可以用似然比(LR)检验来进行比较。对于2PL和3PL模型的选择,LR检验的零假设把猜测参数设置为它们的下界0,这违反了似然比检验的前提假设之一,在这种非标准情况下,通常的卡方渐近分布就不适用了。现代评论杂志揭示,这个问题在教育测量领域没有被广泛意识到。而忽视这个问题将导致选择一个过度简化的模型,进而影响能力的估计。为了解决这一非标准情况下的问题,并提供一种合适的选择最优项目反应模型的方法,在(Christy Brown,Jonathan Templin&Allan Cohen(2014))一文中,该文研究当使用LR检验来选择项目反应模型时,应该选择的零分布等问题。该文的模拟研究结果表明了问题的本质,即当使用一个不正确的零分布时,会导致一个低于名义?水平的第一类错误以及势的降低。当LR检验的零假设中只有一个猜测参数为边界值时,LR检验统计量的渐近分布为一个混合卡方分布,其他情况下的LR检验统计量的渐近分布则未知。考虑到在实际应用中的需要,以及基于这种特殊情况下的零分布,该文提出了一种方法来处理LR检验的非标准情况,但是这种方法进行LR检验的次数太多,执行的过程比较麻烦。本文从局部独立性假设的角度出发,用LR检验比较2PL与3PL模型,并重新推导项目参数的估计过程,对原方法加以改进,提出一种比较简单便于执行的方法。实施改进的方法时,其过程比原方法简便得多,大大减少了检验的次数,而且模拟结果的效果也不错。最后,对改进的方法做一些讨论。