计算机自适应测验中选题策略的分析比较

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:xlr9900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考试是一种很好的评价教师的教学质量与学生知识技能的一种方式,目前国内考试大多采用传统的纸笔测验形式。但是纸笔测验对所有的被试者都是采用相同的试题,不能根据学生实际情况提供相应的测验题目,题目难度太难或太简单都可能导致测试结果毫无意义,不能测量出被试的真实能力水平。而计算机自适应测验(ComputerizedAdaptive Testing,简称CAT)通过自适应选题策略控制每个被试的测验题目,实现“因人施测”,能够为每一位被试提供与其能力水平相匹配的测验题目,从而有效的测量出被试者的真实能力水平。目前计算机自适应测验在国外得到了广泛的应用,如GRE、TOEFL和GMAT等。计算机自适应测验较传统纸笔测验有新的特点:1、自适应选题,2、测验不受时间和地理位置的限制。选题策略,作为计算机自适应测验过程中的核心部分,关键环节,关系到测验的效率、准确性、安全性、公平性等问题。由此可见选题策略在计算机自适应测验中尤为关键。本文采用比较研究的方法,对最大信息量和a分层这两种选题策略进行了比较研究,分析不同策略对各项测试指标的影响,分析二者的优缺点,以及a分层方法中对测验效率和项目曝光度的折中考虑,为以后计算机自适应测验在实施过程中选择合适的选题策略提供参考。本文通过计算机模拟的方式进行实验,模拟了一个完整的计算机自适应测验过程:①试题库和被试者的生成,利用蒙特卡罗方法产生被试能力和项目参数的模拟值,并检测生成的题库项目难度和被试能力分布满足正态分布要求,以此模拟现实中的试题和被试者。②测试过程,被试答题和选题过程的模拟,根据被试能力和相应题目难度确定被试对题目的答对率,利用随机概率确定对题目的反应结果,并根据被试对题目的回答自适应更新被试估计能力,并作为选择下一题的依据,本阶段主要采用了两种选题策略进行选题——a分层和最大信息量。实验最后对不同选题策略的测试结果进行了综合全面的分析,如测验效率、项目曝光度、测试重叠率,测验准确性等。结合两种选题策略的选题原理,以及两种选题策略下实验结果的分析比较,本文得出如下结论:最大信息量法只考虑测验效率,没有刻意进行项目曝光度控制,以此实验结果显示该方法具有较高的测验效率,但项目曝光率极不均匀,而a分层法进行控制项目的曝光率的优化,具有更均匀的项目曝光率,但是牺牲了一点测验准确性。实验结果说明通常测验效率提高和项目曝光率的控制存在冲突,不能同时得到满足,需要在二者之间进行折中,才能更好的在计算机自适应测试中使用。
其他文献
切实加强选拔任用干部责任制——从汾西县买官卖官案看干部制度建设的重要性□中共临汾地委委员、纪委书记王万年发生在吕梁山中的汾西县买官卖官案,留给人们的思考是多方面的
由于互联网技术的日益迅猛发展和知识密集型行业的快速增长,人们的上网活动信息化进程也得到了加速。在对网络用户行为进行深入的研究的基础上,对用户的显性信息需求进行直接
威权主义在东南亚的存在是一种特殊的产物。东南亚国家和地区自身的经济、政治、文化、社会等状况对威权政体的产生和存在有深刻的影响。在新兴国家发展初期,威权政体确实发
根据希波克拉底的性格分析法对学生的性格进行分类,然后根据不同的性格特点在学生管理工作中进行差异化管理,得以提升学生管理成效。
随着新课程改革的推行,全国大中小学校都在进行大力改革。小学语文识字与写字教学在语文教育中具有重要的作用。对小学识字与写字教学的方法进行思考,对语文教学中存在的问题
<正>目前我国企业已经步入稳步发展阶段,但是仍然面临着各种各样的经营风险,其中财务风险是企业面临的最大风险之一。财务风险贯穿于企业生产经营的全过程,与企业的生存和发
新课程背景下的课堂教学,要实现以学生为本,尊重学生的学习主体地位,学生要成为真正意义上自主学习的主人,这就要求教师主动实施由"教为主导"到"以学为中心"的"学为主导"课堂
对中小企业实施分析型CRM的必要性进行了分析,结合中小企业的经营特点,提出了中小企业分析型CRM框架的设计原则,并从主体结构、数据处理两个方面提出了一种分析型CRM框架的设
桩土应力比是反映复合地基工作状态的重要参数,前人做了较多的理论工作,但理论解通常是在桩顶铺设砂垫层情况下推出的。在路堤荷载下浆固碎石桩复合地基一般在桩顶设置盖板,
当前,以城镇职工基本医疗保险、城镇居民基本医疗保险和新型农村合作医疗组成的城乡医疗保险制度体系已经全面建立,全民医保的目标即将实现。不过,上述城乡三项医疗保险制度均以