评分员信度LONGFORD方法计算和实验研究

来源 :北京语言大学 | 被引量 : 9次 | 上传用户:ahutxhb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文有两个内容。一是介绍一种评分员信度的计算方法——LONGFORD方法。该方法以概化理论和方差分量分析为理论基础,可以估计出真分数、评分员严厉度和误差的方差,并可以考察每个评分员的评分情况以及给同一个被试评分的每一对评分员的评分情况,因而能够较全面地对主观测试评分的质量进行评估。我们根据模型要求,组织了一次评分。12名评分员采用5分量表给HSK(高等)340份作文答卷评分,每一份作文由两个不同的评分员独立地评出分数,然后用LONGFORD方法对评分信度进行评估。二是对同一批作文的两次评分——评分员间一致性较高的评分(简称为RH,rating of higher inter-rater reliability)和评分员间一致性较低的评分(简称为RL,rating of lower inter-rater reliability)——用LONGFORD方法进行比较,为将评分员信度理解为主观测试信度寻找经验证据。根据罗德和诺维克的理论,RH和RL之间应有在τ-等价关系,τ-等价的测量具有相同的真分数,相同的样本期望值。只有证明了RH和RL之间存在τ-等价关系,我们才可以说RH是在同一个测度上比RL更精确的测量。实验得到的结果是矛盾的。平均数差异的显著性检验表明,这两次评分的平均数差异基本不显著,部分地证实了RL和RH之间是τ-等价关系。我们用LONGFORD方法估计出这两次评分的方差,然后进行方差差异的显著性检验。结果是,RL和RH的方差总和差异不显著,这表明RH不能减少方差总量;RL和RH的真分数方差差异显著(RH>RL),误差方差差异显著(RH<RL),表明RL和RH之间不存在τ-等价关系。虽然RH的误差较小,但RH和RL可能是对不同测度的测量,二者测到的可能是不同的东西。评分员信度问题,还需要进一步的研究和认识。
其他文献
市场权力是指在市场环境中一个或一组企业对某一产业价格和生产决策的控制程度。拥有市场权利的公司可以通过控制发电量或价格来达到影响市场价格的目的。市场权利存在于很多
随着国民经济的迅速发展,人民的生活水平得到进一步提高,大众对自己的健康越来越关心,对体育健身即身体自身的价值有了更深的理解。花钱买健康、享受生活、提高生活质量成为人们
为了定量测量双套管密相气力除灰系统管道内的气、固两相流动速度,可应用电容层析成像分析技术和电容相关测速的方法.即利用电极外部环绕被测区域内物质不同的分布状况而导致
在论述电压源型SMES(VSMES)调节输出功率的机理的基础上 ,利用MATLAB建立了VSMES的时域仿真模型 ,利用所建立的模型 ,分别对VSMES的有功功率、无功功率及有功和无功同时独立
目前,在偏远的农村,使用的S9变压器存在被盗现象.新型的S11卷铁芯变压器与S9变压器相比,不仅有很大的技术优势,它还具有防盗、节能、实用等优点.由于S11卷铁芯变压器的铁芯是
已有研究证明,在读者不能意识到词汇的存在(阈下知觉)时,词汇的语义依然得到加工。  本研究使用持续闪烁抑制(Continuous Flash Suppressionparadigm,CFS)范式使刺激在阈下呈现,
作为一名班主任,会和各种各样的学生与家长相遇,与千差万别的家长朋友沟通是无可避免的,也是班主任工作中的重要组成部分。有效的家校沟通能形成教育合力,对学校教育起到积极
期刊
从历史上看,即便A、B股价差达到3倍以上,亦仅有少量公司进行回购投资行为2011年12月6日,重庆长安汽车股份有限公司在停牌50天后发布了“重大事项”的内容——拟以不超过6.1亿