国际大规模数学测评研究

被引量 : 43次 | 上传用户:leohuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十世纪中后期,随着对人力在社会经济发展中作用的认识和注重,各国或地区日益关注本国或本地区教育对于人力的培养,关注教育过程及教育体系的质量和效果。国际大规模测评得以形成并发展。同时数学作为现代科技发展中必备的基础性和工具性学科,数学成为现代经济发展中人才的基本素养之一。鉴于各国在数学课程上存在的极大相似性,国际大规模数学测评得到各国日益重视,并在国际大规模测评中独树一帜。以国际教育评估协会(IEA)开发的TIMSS数学测评和经济合作发展组织(OECD)负责的PISA数学测评为代表的国际大规模数学测评发展至今,已成为反馈、比较不同国家、地域或文化间数学教育质量及效果,并有助教育管理、政策制定或调整的国际平台。将国际大规模数学测评本身作为研究对象是非常让人感兴趣的事。2012年数学是PISA测评的主测领域。同年,上海继2009年参加PISA测评后,再次参加该测评,并在数学测评结果显示上位列所有参加测评国家和地区的第一位。但让我们更为感兴趣的是,在上海参加测试群体中,既参加2012年PISA数学测评,又参加上海初中毕业统一学业考试数学测评(简称上海中考数学测评)的全部1953名初三学生,他们在相隔不到两个月参加的大规模数学测评上所得成绩相关系数为0.71。国际大规模数学测评与上海中考数学测评在同一群体上的成绩差异及影响因素引起我们极大的注意和思考。本论文基于上述,解析国际大规模数学测评内在的系统构建,并以国际大规模数学测评内在的系统构建为视角,透视上海中考数学测评结果差异的缘由以及深入分析测评系统构建的必备性。这也形成了本论文的研究目标。论文首先将国际大规模数学测评内在的系统构建及特点纳入研究视野。为了便于研究的展开,先基于梅斯雷弗(Mislevy)对于测评基于证据推断的本质理解,将以证据为中心的测评系统设计结合美国国家研究协会(NRC)所提出的“测评三角”,将“认知”“观察”和“解释”作为大规模数学测评比较分析的三个维度。再以TIMSS数学测评和PISA数学测评为例,先利用历史研究法,纵向分别就两个测评系统在各个分析维度上的发展脉络进行梳理分析;然后通过横向的比较研究,通过剖析两个测评在系统构建上的相似性和差异性,凸显国际大规模数学测评内在的系统结构特征及存在的内在联系性。其次,我们进一步展开定量分析。首先以参加PISA2012数学测评和上海中考数学测评初三1953名考生的相关数据(包括数学成绩以及相关非认知结果等),探寻国际大规模数学测评与上海中考数学测评在内在系统结构上的差异对上海中考数学成绩的影响。随后利用国际大规模数学测评在学习结果影响分析模型构建上的工作,结合PISA2012数学测评在学习机会——内容、教学实践和教学质量以及数学学习动机和信念上的数据,在学生个体和学校层面,利用多层线性模型(HLM),分析在上海中考数学测评和国际大规模数学测评成绩上影响因素的差异。量化结果显示,不同大规模数学测评结果在学习结果影响因素上存在着差异。这也提示上海中考数学测评需建立自己学习结果影响分析模型或质量评价分析系统。通过上述研究,我们发现:(1)不同的国际大规模数学测评的发展历程存在相似性。该相似性不仅表现在研究和政策驱动上的融合,表现在目标分析框架、学习结果影响分析模型的建立和测评技术方法的运用上,还表现在发展阶段——先目标分析框架,内容维度量尺建立,量尺分层描述,到认知过程维度量尺建立,整个过程的一致性上。(2)大规模数学测评构建的基础是系统内在的一致性。测评系统的三要素,“认知”——测评目标分析框架,“观察”——测评蓝图、题型的使用和编码系统设计,“解释”——量尺的形成、统计模型的使用、基准或精熟度层次的划分,在测评中各司其职,相互依存,相互制约,甚至相互修正,形成整个大规模数学测评内在一致性,保证了测评结果可靠性和有效性。同时基于大规模数学测评内在一致性,国际大规模数学测评还体现出测评系统的综合——技术方法的综合运用,连续性——不同年份测评结果可比性得以确立。(3)测评目标框架对测评目的的凸显作用。对于课程的不同认识,对于测评目的,是应体现已知什么和能做什么(TIMSS数学测评为例),还是应体现应知什么和怎么做(PISA数学测评为例)。TIMSS数学测评以纯粹知识体系或线索为中心表现学习结果及水平,而PISA数学测评以能力线索为中心,以问题解决为平台表现学习结果及水平。不同的国际大规模数学测评展开了不同的测评目标框架设计,并据此相应在系统要素观察——题型题量分布,以及解释——量尺构建上形成差异性。(4)大规模数学测评目标框架中不同维度内的变化会影响测评结果。针对国际大规模数学在测评目标框架上内容和认知过程两维的设计,以PISA数学测评为例,其与上海中考数学测评在内容和过程维度上试题题量分布的差异,分别对上海中考数学成绩差异达到37%左右的解释率(其中内容维度上的差异对上海中考数学成绩差异解释率达36.7%,而过程维度上的差异对上海中考数学成绩差异解释率达37.3%)。同时过程差异指标的提升一个单位,对中考测评成绩的影响要比内容差异指标的单位提升影响更大。测评目标框架作为测评系统“认知”要素的具体体现,同时鉴于其对其它要素的统摄性,上述案例显示在大规模数学测评系统内在构建上的差异,甚至具体到相同维度上试题分布的差异都会影响测评结果。(5)不同大规模数学成绩的因素影响存在差异性。对于同一群体,在不同测评上所得成绩的影响因素有相同之处,但也有存在不同之处,甚至显著性程度也不一样。同时在不同层次上,对同一群体,同一因素的影响显著性也存在不同。对于不同的数学测评结果,在不同因素之间存在中介效应。特别是数学自我效能和数学工作伦理,前者对PISA和上海中考数学测评成绩在学生和学校层面都有显著性影响,而后者仅仅对上海中考数学测评成绩有显著性影响。同时后者对于上海中考数学测评显示出显著的中介效应。显示出上海中考数学测评学习结果影响因素存在独特性,需要我们建立自己的学习结果影响分析模型和质量评价分析系统。鉴于上述,我们通过分析上海中考数学测评系统要素上的现有表现,指出其内在一致性存在不足,以及结果解释几乎缺失。这会极大影响上海中考数学结果的有效性和可靠性,影响对初中数学学业水平的界定及对教学的反馈。论文最后针对上海中考数学测评系统,在大系统观的确立和测评目标框架的统摄性上,以及在上海中考数学测评基础建设上,如核心能力标准的制定,数学问题解决测评框架的建立,数学测评目标框架内容和过程上相关内容选择等方面进行分析和建议,以助于提升上海中考数学测评系统内在的一致性建设以及结果的解释,对中考数学的改革在实施层面提供依据和参考。
其他文献
文章从经济总量、综合国力与国家安全系数的关系 ,全球化、国际产业转移和中国市场潜力的关系 ,地缘经济与地缘政治的关系 ,国际体系、国家主权和国家制度建设的关系 ,国家认
半导体制冷技术的研究已有多年的历史,但其在家用制冷器具上的应用在国内尚属起步阶段,这主要是因为半导体制冷比传统压缩式制冷效率低得多的缘故,但半导体制冷有其独特的优
在对东营石油装备制造业集群35家企业进行问卷调查和深度访谈的基础上,探究了区域和跨区域两种空间尺度下的非正式联系及其对技术创新的影响。结果表明,区域尺度的非正式联系
党的十八大上“中国梦”的伟大构想“国家富强、民族振兴、人民幸福”一经提出就成为全国人民关注的热点。随着我国综合国力增强,人们生活水平日益提高,人民不再满足于物质需
舒曼晚期"家庭音乐"创作在各方面受到19世纪中叶欧洲中产阶级文化的影响:中产阶级社会政治气候的变化以及市场经济的发展是促使舒曼晚期转向"家庭音乐"创作的两大推动因素;中
<正>阿Q之死示众这个热闹的死亡场景,反衬了民众对生命意识的淡漠与人性的缺失。鲁迅通过看客如同不远不近的跟定了他的眼睛折射出大众因为仇视异端或渴求刺激甚至习以为常的
宗教文化对构建社会主义和谐社会来说,具有非常重要的作用。毛泽东提出,要把宗教当作文化来研究;江泽民指出,要积极引导宗教与社会主义社会相适应。我国56个民族中有一亿多信
指出高层建筑火灾蔓延速度快、人员疏散困难、灭火救援困难,极易造成较大的生命和财产损失,该类建筑的消防安全问题应被高度关注,认真分析了高层建筑的火灾特点和当前该类建
本文从物流信息技术专业的学生职业核心能力进行分析,探索了物流信息技术专业生产性校企合作模式,并对生产性校企合作培养物流信息技术专业学生职业核心能力进行研究,对初步
实施有效的内部控制是企业防范经营风险、实现持续发展的必要条件。而由于各种原因,企业的内部控制建设还存在很多问题,各种风险事件也屡见不鲜。本文以云铜集团为例就企业内