运用概化理论多侧面模型分析CEPT口语考试的评分员信度

来源 :湖南大学 | 被引量 : 0次 | 上传用户:HNLYLKT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
口语测试作为一种体现考生真实交际水平的测试手段是任何其他测试所不能达到的,因此,任何一个科学和理想的语言测试必须要包括口语测试。但由于口语考试自身的特点和评分的主观性,使得口语考试的评分工作面临着很多困难和挑战。这其中就包括了很多由测量误差所引起的评分信度不高的因素。概化理论作为一种现代测量理论,对口语评分信度的测量提出了全新的测量方法。首先在可观测的全域之上,明确测量目标、测量侧面及其相互关系。并在此基础上设计出交叉设计、嵌套设计和混合设计。其次,运用实验设计和方差分析的方法对实验数据进行分析,估计出各种变异来源对分数总变异所做的贡献,这也就是概化研究的过程。在决策研究阶段,通过修改不同的测量侧面、样本容量和测量结构等以达到试验设计人员想要的目的。本文正是运用概化理论对湖南大学英语分级考试中口语考试部分评分员信度问题所做出的研究。通过分析,本研究得出以下结论:1)本次口语考试评分员的整体信度很高。但也显示出了较显著的严厉度的差异。其中,3号评分员的严厉度水平是最低的。5号和6号评分员显示出了高度的评分一致性。并且,整个口语试题的难度适中,区分度也较理想。2)通过对不同测量条件下试题侧面的决策研究,估计出当试题侧面达到6个时,G系数达到了更高的信度水平。3)在决策研究中,分别估计出了评分员从1到10个范围内信度指标的变化情况。研究得出了在不同试题侧面条件下,多少个评分员就可以达到比较高的信度值。4)通过对不同测量侧面的调整和估计,研究得出了最优化的设计方案。即,当试题侧面为6,评分员侧面为4时,即可达到初始设计时的高信度水平。本文的研究首先体现在首次对湖南大学英语分级考试口语部分的整体评估和评分员信度分析,因此具有十分重要的意义,并为其进一步发展和完善提供了实证依据。研究结果指出了口语测试部分现存的问题并提出了修改建议,并显示出了不同评分员的内部一致性水平差异,对甄选合格的评分员提供了参考。另外,本研究中采用概化理论来检测大规模口语考试中评分员信度的检测方法,不仅对英语分级考试提供了检测方法的参考,还对其他同类主观评分具有重要的参考价值。在最后,作者还提出了本研究的局限和不足以及在此领域有待进一步研究的问题。
其他文献
针对王庄煤矿540回风大巷一掘进面煤层透气性较差、煤层瓦斯难以抽放的特点,采用CO2高能气体预裂增透技术对该工作面进行了CO2气相压裂增透技术试验。试验结果表明,预裂后防
目的慢性肾脏病(CKD)无法治愈,护理干预有助于病情的控制,本研究旨在探讨护理营养指导干预在提高CKD患者自我管理与改善生活质量和健康状况中的作用。方法选取2015年1月至201
唐诗作为中国文化的重要组成部分,历来被视为中国诗歌的精粹,倍受国人喜爱。迄今为止,已经有大量唐诗被翻译成英语。随着大量唐诗被译成英语,许多研究者从不同的视角对各名家
绘本是以图画为主要表达形式的图书,十七世纪流行于欧洲,现如今成为全世界各国儿童及成年人最喜爱的读物之一。绘本内容极为丰富,情节故事、理性概念、哲学思想、美育常识、
儿童期机体处于不断生长发育的阶段,因此,表现出的基本特点有三方面:①个体差异,性别差异和年龄差异都非常大,无论是对健康状态的评价,还是对疾病的临床诊断都不宜用单一标准衡量。
【正】中华书局1985年出版的宋人笔记《青箱杂记》(李裕民点校)卷8中,有一段长达609字的衍文,兹迻录于下: 杨浞《词说》栽温公《西江月》词云:“宝髻松松梳就,铅华淡淡妆成
在中国的文学史上,乐府诗占有及其重要的地位,它为我国诗歌乃至词曲在后代的繁荣与发展奠定了基础。尽管很多乐府诗歌的作者现已无从考证,但诗歌中鲜活的形象和内容,以及精炼
《归家》是二十世纪英国最杰出的荒诞派剧作家的哈罗德·品特的一部作品。一个多世纪以来,品特及其作品一直以来是中外学者研究的热点,这些研究从社会学,普通文体学,唯美主义