论文部分内容阅读
项目反应理论(IRT)的几个假设是估计 I RT参数所必需的。通常存在三种假设:(1)将特定被试若干题目的反应概率相乘,估计被试者的能力参数;(2)将若干被试者对同一个题目的反应概率相乘,估计题目参数;(3)当题目和能力参数均未知,则要对这两类参数做联合估计。
一、项目反应理论模型发展
用来描述IRT模型有很多种。本文主要讨论单维二值反应模型。
(一)正态拱形曲线模型
1952年,Lord提出了双参数正态拱形曲线模型 ( two-parameter normal ogive model),其表达式为:Pt(H)=ai(H-bi)edz。其中Pi(H)表示能力为H的被试者在项目i上的正确作答概率。项目特征曲线为 S形, 因为它形同累积分布函数且是中心对称的,自然假设曲线可用正态分布的形式来描绘它。bi与能力定义在同一量表上,为难度参数,也称为曲线的定位参数;而ai则被称为区分度参数,是曲线拐点处的切线斜率的函数,ai越大,曲线越陡峭,反之亦然。该模型对于帮助理解项目反应理论模型的特性以及模型参数的均有重要意义。但由于采用积分函数形式,不利于进一步的分析计算。
(二)Rasch模型
Rasch模型是丹麦学者 Rasch于 1960年提出的测量模型。该模型的特点是完全根据被试的能力水平和项目难度的关系而推导出的正确作答概率公式,其表达式为:Pi(H)=。式中符号代表的意义同正态拱形曲线模型相同。Rasch模型中只有一个项目参数,因而该模型又称作单参数模型,简称 1- PL模型。
(三)Logistic模型
针对被试者在客观多项选择题和是非判断题上可能出现的猜测现象, Birnbaum 增加了猜测参数c,并于 1957年到1958年将 Lord的双参数正态拱形曲线模型改为 Logistic模型,其表达式为:Pi(H)=ci+。其中D为1.7,参数ai、bi与正态拱形曲线模型中的定义相同。这就是三参数 Logistic模型 [简称3-PL模型 ]。易知,若答题过程中没有猜测因素,即c=0时,该模型则为双参数 Logistic模型 [简称 2-PL模型 ];若双参数 Logistic模型中ai=1,该模型则为单参数 Logisti c模型,其形式同Rasch模型。
二、参数估计方法研究
应用IRT模型对项目的不同参数进行估计是连接项目反应理论与应用的最关键的环节。所谓参数估计是指根据被试者的作答反应矩阵估计出被试的能力参数和每个项目的参数。
(一)极大似然估计法
极大似然估计法是根据被试者的作答反应矩阵,在局部独立性的条件下,导出参数估计的似然函数,然后通过求取似然函数的极大值,估计项目参数和被试能力参数。当参数变化时,概率的非极大值可能不止一个,但极大值一般只有一个。极大似然估计法又可细分为如下三种:
(1)联合极大似然估计法 ( JMLE )
在测量实践中,一般的情况是既不知道被试者的能力H,也不知道项目参数,因此只能同时对这两个参数进行联合极大似然估计。该方法是 Birnbaum首先采用的,公式为:L(u1,u2,u3…,un|H) =。其中uij是考生 i对反应模式为 ( 1,2 ,3,….,n)的第 j题的反应,pij表示能力为Hi的被试者答对第 j题的概率,Q1-表示能力为Hi的被试答错第j题的概率。
(2)条件极大似然估计法 (CMLE)
该方法的前提是得到能力参数的充分统计量。因为 Rasch模型的实得分数是被试能力参数的充分统计量,所以对于 Rasch模型可以采用条件极大似然法进行参数估计。但是对于二值计分的双参数模型和三参数模型以及多值计分模型都不能运用这一种方法。
(3)边际极大似然估计法 (MMLE)
对 Rasch模型来说,条件极大似然估计的效果基本上和边际极大似然估计相近。但边际极大似然估计的一个最大缺点是运算量太大,需要进行大量的积分运算,因而只要项目数稍多,则无法实现。
综上,虽然极大似然估计具有一致性、渐进正态性和有效性等基本性质,成为一种应用最为广泛的参数估计方法,但它也有两条明显的缺点:(1)没有利用被试者能力的先验知识; (2)对于满分和零分的被试者无法进行参数估计。
(二)贝叶斯估计法
贝叶斯估计方法是指利用贝叶斯原理,确定项目参数和被试者能力参数的先验分布,建立联合极大似然函数,然后通过求取联合极大似然函数的极大值,估计出项目参数和被试者能力参数。对被试者相应能力的先验概率分布同测验使用的时间长短是正向关系,有可能做出较为客观的估计,但是对项目参数先验概率分布的估计则纯粹是主观的。
三、结语
各参数的先验概率分布确定之后,贝叶斯估计和极大似然估计的方法大致相同。贝叶斯估计方法运用于二值计分模型也是可行的。对于等级计分模型,由于每题有多个难度值,而且这多个难度值有可能是逐渐增大,也有可能是没有变化规律的,项目参数的先验分布难以确定。因此贝叶斯估计方法运用到模型参数当中,仍有许多理论上和技术上的问题未解决,而且关于估计方法的稳定性还缺乏证据。
(作者单位:辽宁工程技术大学经济管理学院)
一、项目反应理论模型发展
用来描述IRT模型有很多种。本文主要讨论单维二值反应模型。
(一)正态拱形曲线模型
1952年,Lord提出了双参数正态拱形曲线模型 ( two-parameter normal ogive model),其表达式为:Pt(H)=ai(H-bi)edz。其中Pi(H)表示能力为H的被试者在项目i上的正确作答概率。项目特征曲线为 S形, 因为它形同累积分布函数且是中心对称的,自然假设曲线可用正态分布的形式来描绘它。bi与能力定义在同一量表上,为难度参数,也称为曲线的定位参数;而ai则被称为区分度参数,是曲线拐点处的切线斜率的函数,ai越大,曲线越陡峭,反之亦然。该模型对于帮助理解项目反应理论模型的特性以及模型参数的均有重要意义。但由于采用积分函数形式,不利于进一步的分析计算。
(二)Rasch模型
Rasch模型是丹麦学者 Rasch于 1960年提出的测量模型。该模型的特点是完全根据被试的能力水平和项目难度的关系而推导出的正确作答概率公式,其表达式为:Pi(H)=。式中符号代表的意义同正态拱形曲线模型相同。Rasch模型中只有一个项目参数,因而该模型又称作单参数模型,简称 1- PL模型。
(三)Logistic模型
针对被试者在客观多项选择题和是非判断题上可能出现的猜测现象, Birnbaum 增加了猜测参数c,并于 1957年到1958年将 Lord的双参数正态拱形曲线模型改为 Logistic模型,其表达式为:Pi(H)=ci+。其中D为1.7,参数ai、bi与正态拱形曲线模型中的定义相同。这就是三参数 Logistic模型 [简称3-PL模型 ]。易知,若答题过程中没有猜测因素,即c=0时,该模型则为双参数 Logistic模型 [简称 2-PL模型 ];若双参数 Logistic模型中ai=1,该模型则为单参数 Logisti c模型,其形式同Rasch模型。
二、参数估计方法研究
应用IRT模型对项目的不同参数进行估计是连接项目反应理论与应用的最关键的环节。所谓参数估计是指根据被试者的作答反应矩阵估计出被试的能力参数和每个项目的参数。
(一)极大似然估计法
极大似然估计法是根据被试者的作答反应矩阵,在局部独立性的条件下,导出参数估计的似然函数,然后通过求取似然函数的极大值,估计项目参数和被试能力参数。当参数变化时,概率的非极大值可能不止一个,但极大值一般只有一个。极大似然估计法又可细分为如下三种:
(1)联合极大似然估计法 ( JMLE )
在测量实践中,一般的情况是既不知道被试者的能力H,也不知道项目参数,因此只能同时对这两个参数进行联合极大似然估计。该方法是 Birnbaum首先采用的,公式为:L(u1,u2,u3…,un|H) =。其中uij是考生 i对反应模式为 ( 1,2 ,3,….,n)的第 j题的反应,pij表示能力为Hi的被试者答对第 j题的概率,Q1-表示能力为Hi的被试答错第j题的概率。
(2)条件极大似然估计法 (CMLE)
该方法的前提是得到能力参数的充分统计量。因为 Rasch模型的实得分数是被试能力参数的充分统计量,所以对于 Rasch模型可以采用条件极大似然法进行参数估计。但是对于二值计分的双参数模型和三参数模型以及多值计分模型都不能运用这一种方法。
(3)边际极大似然估计法 (MMLE)
对 Rasch模型来说,条件极大似然估计的效果基本上和边际极大似然估计相近。但边际极大似然估计的一个最大缺点是运算量太大,需要进行大量的积分运算,因而只要项目数稍多,则无法实现。
综上,虽然极大似然估计具有一致性、渐进正态性和有效性等基本性质,成为一种应用最为广泛的参数估计方法,但它也有两条明显的缺点:(1)没有利用被试者能力的先验知识; (2)对于满分和零分的被试者无法进行参数估计。
(二)贝叶斯估计法
贝叶斯估计方法是指利用贝叶斯原理,确定项目参数和被试者能力参数的先验分布,建立联合极大似然函数,然后通过求取联合极大似然函数的极大值,估计出项目参数和被试者能力参数。对被试者相应能力的先验概率分布同测验使用的时间长短是正向关系,有可能做出较为客观的估计,但是对项目参数先验概率分布的估计则纯粹是主观的。
三、结语
各参数的先验概率分布确定之后,贝叶斯估计和极大似然估计的方法大致相同。贝叶斯估计方法运用于二值计分模型也是可行的。对于等级计分模型,由于每题有多个难度值,而且这多个难度值有可能是逐渐增大,也有可能是没有变化规律的,项目参数的先验分布难以确定。因此贝叶斯估计方法运用到模型参数当中,仍有许多理论上和技术上的问题未解决,而且关于估计方法的稳定性还缺乏证据。
(作者单位:辽宁工程技术大学经济管理学院)