论文部分内容阅读
计算机自适应测试CAT (Computerized Adaptive Testing)具有许多传统纸笔测试所无法比拟的优势,可以依据被试个体不同的被试状态,个性化地提供动态测量服务。项目反应理论IRT(Item Response Theory)的测试较之于经典测试理论,有样本独立、可反复测量等优点,但算法过于复杂,实际应用起来难度大。基于项目反应理论的计算机自适应测试能充分发挥两者的优势,它的目标是为每个被试构建最佳的测试,能根据一个用于描述被试反应的IRT理论模型,选取与被试的估计能力水平相匹配的项目,通过排除控制难度与被试能力不适合的项目,缩短测试时间,提高测量精度,减少因被试测试粗心、疲惫、沮丧或猜测所引起的各种测量误差。选题策略是CAT的一个重要问题,它的好坏直接影响到测验的安全性、准确性和效率。目前常用的CAT选题策略是a分层方法,但它的实际应用存在一些问题,使我们急需对它进行改进。a分层选题策略存在一些挑战和难点:层次划分数、各层信息量的设置、项目难度参数应服从的分布、基于a分层选题策略终止测试条件的设定等。本文结合项目实际情况,在分析与比较现有的参数模型、参数估计算法基础之上,采用Logistic二参数单维模型、极大似然参数估计的测试方案,并改进a分层选题策略以及基于a分层选题策略的最合适终止测试条件,提出包括测试的终止条件应设为已测项目的信息总量或题目总数达到预定标准,各层信息量应占比例应逐渐上升,项目难度参数应服从均匀分布等,优化了a分层选题策略,能显著提高计算机自适应测验(CAT)的准确性和稳定性。最后,基于优化后的a分层选题策略及终止测试条件,设计并实现电子商务师自适应考试的原型系统。上述成果在上海交通大学和上海美华系统有限公司共同承担开发的由上海市职业技能鉴定中心委托的“电子商务职业开发项目”进行了相关理论的测试。本文首先对a分层选题策略和终止测试条件做了综述,分析和比较各选题策略和终止测试条件的优劣;其次,总结分析了a分层选题策略和终止测试条件的需求和挑战,并在此基础上归纳出影响a分层选题策略的因素;然后提出改进的a分层选题策略和基于它的终止测试条件;最后设计并实现电子商务师自适应考试的原型系统,验证本文方法的可行性。