论文部分内容阅读
随着计算机在个体家庭中的日渐普及,基于个人电脑的信息技术已全面融入到了我们的工作学习当中,并且深深的影响着我们的日常生活。近些年来,信息技术的发展带来了信息总量的几何式增长,以及数据库数据量的爆炸式发展,这些所有的一切对经济生活中的各个领域都产生了无比深远的影响。在商业、经济领域,决策的制定将日益取决于数据及其分析而作出,而非基于传统的经验和直觉;在公共事业和教育领域,通过数据分析来制定决策的方法,也吸引了越来越多学者们的关注,因此可以说大数据(Big Data)[1-2]的浪潮正悄然来临。
大数据概念的提出最早可以追溯到2008年,在美国科研期刊《Nature》中刊登的一篇题为“Big Data”的评论[3],随后大数据便广泛引起了各个领域学者们的关注。时至今日,大数据理论正逐渐被丰富,而我们认为大数据就是指所涉及的数据量规模巨大,无法通过人工的方法在合理时间内达到截取、管理、处理,并整理成适合人类解读的信息。在总数据量相同的情况下,与分析独立的小型数据集相比,将各个小型数据集合并后进行分析可以得出许多额外的信息和数据关系性,因此我们认为大数据在教育上可以被用来预测分析学生学习过程中可能遇到的难点,为学生定制学习计划,以及预测教学过程中可能遇到的困难。
大数据给我们的教育带来了一系列的变化,首先是教育数据总量[4]的增长由TB级升至PB级,各个教育机构存在着自己的数据库,教育数据资源丰富且存量巨大;其次是分析需求由常规分析转向深度分析,数据分析日益成为教育中不可缺失的支撑点,个性化的教学服务逐渐取代传统的以教师为主导的教学方式;最后是教育逐渐由教学市场转化为需求市场,教育不再仅仅是照本宣科,而转化为满足社会人才需求的一种方式。
大数据根据来源可分为三类:(1)科研数据,它主要是以实验或者建立模型模拟来获得数据的传统学科(如物理学,数学,化学,环境工程学,机械学等),对这类自然学科的研究产生了越来越多的数据。(2)互联网数据,现有研究表明,谷歌公司每天要处理超过 24PT 的数据,是美国国家图书馆所有纸质出版物所包含数据量的上千倍,新浪腾讯上每天都会有几亿条微博出现,Facebook上每天有上千万张的照片更新和几十亿次的点击率,百度每天处理数十亿次搜索指令,近几年来兴起来的购物网站如淘宝网,京东商城,当当网和一些团购网站每天的交易量都上亿次。(3)感知数据,进入移动互联网时代后,移动平台的感知功能和基于位置的服务普及产生了大量感知数据,各个城市的视频监控每时每刻都在采集巨量的流媒体数据,工业监控也是大数据的重要来源。感知数据与互联网数据会产生重叠,而且不同于科研数据,他们不但非结构化数据多而且数据的实时性强,大量数据都是随机动态产生,所以社会科学的大数据分析,特别是根据 Web 数据做经济形势和社会群体事件的预测,比自然科学的数据分析更困难。
上海海事大学经济管理学院管理科学系副教授魏忠就曾说过,以物联网、云计算等综合技术的成熟为基础,在学生管理数据库中挖掘出有价值的数据[4],经过过程性和综合性的考量,找到学生各种行为之间的内在联系,考量背后的逻辑关系,并作出恰当的教学决策,这才能被称为大数据。随着科学技术的发展,大数据在教育行业的应用也越来越广泛[5]。早在2009年,孟加拉裔美国人萨尔曼?可汗就利用网络视频进行免费授课,授课的内容涵盖着教学中的各个科目,他的教学视频像病毒一样广为传播,如今全球已有成千上万的学生通过互联网学习其视频课程。随后,网络课程如雨后春笋般冒出,全世界的各大知名學府都加入到在线教育的行列。在宾夕法尼亚州,从小学到高中都建立了在线学校,甚至有的地方还会免费为选择参加在线学习的学生配发笔记本电脑、打印机和扫描仪,作为学习的工具。在教育管理方面,以在线教育为代表的各种综合技术的集合,可以通过大数据的分析来进行优化,做出更科学的决策,这将带来潜在的教育革命。例如,甲同学做对了第3题,系统会立即告诉他可以跳过考查相同知识点的第5题,如果做错了第8题,那么系统就会提示他继续练习第9题,因为考查的这个知识点可能正是该学生需要反复进行操练与巩固的。这种学习分析系统让学生因材施教具有了可能。近年来,我国也已经有不少学校开始对数据挖掘进行探索,其中比较典型的有东华大学的智能实验室项目。几年前,东华大学的实验室极为分散,十几个学院,每个学院都有三四个实验室,教学评估要通过表格填报的方式来解决,数据的科学性和真实性都得不到保障,东华大学教务处处长吴良深感人工管理太吃力、效率也太低。09年,他们提出智能管理的思路,即用物联网的方式把实验室里所有的仪器设备都管理起来。和专门研究数据挖掘的公司合作,在材料学院做了试点。只要学生进入实验室,哪个学生使用了哪台仪器设备,使用了多长时间,基本所有的使用情况都能记录下来,所有仪器的电流、电压都可以监控。之后想要的数据由电信号直接产生,自动计算出来自动生成表格,实验室利用率等情况在表格上一目了然。从表格就可以看出,哪些实验室申请的设备根本不必购买,哪些实验室不再需要拨钱。实验室的使用率和第二年的经费完全挂钩,最后实现教育经费使用的集约高效。另外,东华大学智能实验室还实现了24小时开放无人管理、跨学院使用等人工无法实现的管理,数据显示,智能实验室的管理对学生学习自主性的提高有显著影响,学生在实验室的时间甚至超过了在教室的时间。浙江大学则通过对资产的归纳、整理,最终形成权威、全面的资产数据,并提供数据查询和分析服务。这些数据分析的成果已经被真正地应用起来,能够帮助教务处更好地利用教室、实验室等资源。复旦大学则对特定的学生进行数据分析,并且得到一些非常有价值的数据。比如,从平均绩来看,来自东部地区、中部地区、西部地区学生的成绩呈递减趋势。在中部和西部地区,城镇学生成绩优于农村学生,东部地区则相反。分析认为,出现这种情况或与学生所受基础教育相关:在中、西部地区,城镇的基础教育资源和水平明显高于农村;而在东部地区,不少农村学生在基础教育阶段反而可能学得更深。清华大学正在做一些学生成长类的数据分析。比如,针对进校时成绩很优秀的一批学生,追踪其在大学四年的各种数据,观察其成长路径,或者对毕业时表现很优秀的学生进行追溯。总体来看,目前高校对信息数据的挖掘主要集中在网络系统所运行的数据分析。而在中小学,对数据的挖掘也在逐渐的兴起。基于电子书包的一对一课堂数字化课堂教学中,国内比较典型的案例是首都师范大学数字化学习实验室开发的数字化课堂的大数据分析应用,已经在扬州、常州等地中小学的200多个班级进行了多个学期的系统性试点应用,带来了教育效果的明显改变。在数字化课堂教学过程中,对学习过程进行大数据挖掘和分析,教师可以即时进行教学控制和反思,从而提高课堂教学水平,学生也可以及时发现自己学习中的不足,进而提高自己的学习水平。在国内的一些发达城市,如北京、上海、广东等,像在线课程、翻转课堂等网络课程,已经有越来越多的学生和工作者在学习和应用。随着技术的发展,大数据在教育领域有了越来越广泛的应用,学校拥有可用的、高质量的海量数据逐渐成为现实,但如何进行信息挖掘,给未来教育带来更大的可能,也对教育研究者的想象力提出了挑战。苏伽特的一个观点很具有代表性:“你能够想象和确认,你所教的和考核的东西,在今后20年学生们走上工作岗位还管用吗?”为此,苏伽特分析,只有三种最基本的东西在今后的大数据时代是学生要用到的和必须学的东西:“第一是阅读,第二是搜索,第三是辨别真伪。”
大数据时代的到来, 让所有社会科学领域能够借由前沿技术的发展从宏观群体走向微观个体,让跟踪每一个人的数据成为了可能,而对于教育研究者来说,我们将比以往任何时候都更接近发现真正的学生。总而言之,大数据为教育技术的发展带来很多可能性 [6]。
参考文献
[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1):146-169.
[2] 刘怡,李慧君.传播学视野中的大数据与新媒体发展——第二届“新媒体与社会发展”全球论坛暨中英新媒体与社会发展双边对话综述[J].现代传播,2013,(1):141-143.
[3]Nature .Big Data [EB/ OL].http://www.nature.com/news/specials/bigdata/index.html.
[4]魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013,(2).
[5]祝智庭,贺斌.智慧教育:教育信息化的新境界[J].电化教育研究,2012,(12):1~13.
[6]杨妮.美国高中个性化教育策略及其启示[J].教育导刊,2013,(1) .
大数据概念的提出最早可以追溯到2008年,在美国科研期刊《Nature》中刊登的一篇题为“Big Data”的评论[3],随后大数据便广泛引起了各个领域学者们的关注。时至今日,大数据理论正逐渐被丰富,而我们认为大数据就是指所涉及的数据量规模巨大,无法通过人工的方法在合理时间内达到截取、管理、处理,并整理成适合人类解读的信息。在总数据量相同的情况下,与分析独立的小型数据集相比,将各个小型数据集合并后进行分析可以得出许多额外的信息和数据关系性,因此我们认为大数据在教育上可以被用来预测分析学生学习过程中可能遇到的难点,为学生定制学习计划,以及预测教学过程中可能遇到的困难。
大数据给我们的教育带来了一系列的变化,首先是教育数据总量[4]的增长由TB级升至PB级,各个教育机构存在着自己的数据库,教育数据资源丰富且存量巨大;其次是分析需求由常规分析转向深度分析,数据分析日益成为教育中不可缺失的支撑点,个性化的教学服务逐渐取代传统的以教师为主导的教学方式;最后是教育逐渐由教学市场转化为需求市场,教育不再仅仅是照本宣科,而转化为满足社会人才需求的一种方式。
大数据根据来源可分为三类:(1)科研数据,它主要是以实验或者建立模型模拟来获得数据的传统学科(如物理学,数学,化学,环境工程学,机械学等),对这类自然学科的研究产生了越来越多的数据。(2)互联网数据,现有研究表明,谷歌公司每天要处理超过 24PT 的数据,是美国国家图书馆所有纸质出版物所包含数据量的上千倍,新浪腾讯上每天都会有几亿条微博出现,Facebook上每天有上千万张的照片更新和几十亿次的点击率,百度每天处理数十亿次搜索指令,近几年来兴起来的购物网站如淘宝网,京东商城,当当网和一些团购网站每天的交易量都上亿次。(3)感知数据,进入移动互联网时代后,移动平台的感知功能和基于位置的服务普及产生了大量感知数据,各个城市的视频监控每时每刻都在采集巨量的流媒体数据,工业监控也是大数据的重要来源。感知数据与互联网数据会产生重叠,而且不同于科研数据,他们不但非结构化数据多而且数据的实时性强,大量数据都是随机动态产生,所以社会科学的大数据分析,特别是根据 Web 数据做经济形势和社会群体事件的预测,比自然科学的数据分析更困难。
上海海事大学经济管理学院管理科学系副教授魏忠就曾说过,以物联网、云计算等综合技术的成熟为基础,在学生管理数据库中挖掘出有价值的数据[4],经过过程性和综合性的考量,找到学生各种行为之间的内在联系,考量背后的逻辑关系,并作出恰当的教学决策,这才能被称为大数据。随着科学技术的发展,大数据在教育行业的应用也越来越广泛[5]。早在2009年,孟加拉裔美国人萨尔曼?可汗就利用网络视频进行免费授课,授课的内容涵盖着教学中的各个科目,他的教学视频像病毒一样广为传播,如今全球已有成千上万的学生通过互联网学习其视频课程。随后,网络课程如雨后春笋般冒出,全世界的各大知名學府都加入到在线教育的行列。在宾夕法尼亚州,从小学到高中都建立了在线学校,甚至有的地方还会免费为选择参加在线学习的学生配发笔记本电脑、打印机和扫描仪,作为学习的工具。在教育管理方面,以在线教育为代表的各种综合技术的集合,可以通过大数据的分析来进行优化,做出更科学的决策,这将带来潜在的教育革命。例如,甲同学做对了第3题,系统会立即告诉他可以跳过考查相同知识点的第5题,如果做错了第8题,那么系统就会提示他继续练习第9题,因为考查的这个知识点可能正是该学生需要反复进行操练与巩固的。这种学习分析系统让学生因材施教具有了可能。近年来,我国也已经有不少学校开始对数据挖掘进行探索,其中比较典型的有东华大学的智能实验室项目。几年前,东华大学的实验室极为分散,十几个学院,每个学院都有三四个实验室,教学评估要通过表格填报的方式来解决,数据的科学性和真实性都得不到保障,东华大学教务处处长吴良深感人工管理太吃力、效率也太低。09年,他们提出智能管理的思路,即用物联网的方式把实验室里所有的仪器设备都管理起来。和专门研究数据挖掘的公司合作,在材料学院做了试点。只要学生进入实验室,哪个学生使用了哪台仪器设备,使用了多长时间,基本所有的使用情况都能记录下来,所有仪器的电流、电压都可以监控。之后想要的数据由电信号直接产生,自动计算出来自动生成表格,实验室利用率等情况在表格上一目了然。从表格就可以看出,哪些实验室申请的设备根本不必购买,哪些实验室不再需要拨钱。实验室的使用率和第二年的经费完全挂钩,最后实现教育经费使用的集约高效。另外,东华大学智能实验室还实现了24小时开放无人管理、跨学院使用等人工无法实现的管理,数据显示,智能实验室的管理对学生学习自主性的提高有显著影响,学生在实验室的时间甚至超过了在教室的时间。浙江大学则通过对资产的归纳、整理,最终形成权威、全面的资产数据,并提供数据查询和分析服务。这些数据分析的成果已经被真正地应用起来,能够帮助教务处更好地利用教室、实验室等资源。复旦大学则对特定的学生进行数据分析,并且得到一些非常有价值的数据。比如,从平均绩来看,来自东部地区、中部地区、西部地区学生的成绩呈递减趋势。在中部和西部地区,城镇学生成绩优于农村学生,东部地区则相反。分析认为,出现这种情况或与学生所受基础教育相关:在中、西部地区,城镇的基础教育资源和水平明显高于农村;而在东部地区,不少农村学生在基础教育阶段反而可能学得更深。清华大学正在做一些学生成长类的数据分析。比如,针对进校时成绩很优秀的一批学生,追踪其在大学四年的各种数据,观察其成长路径,或者对毕业时表现很优秀的学生进行追溯。总体来看,目前高校对信息数据的挖掘主要集中在网络系统所运行的数据分析。而在中小学,对数据的挖掘也在逐渐的兴起。基于电子书包的一对一课堂数字化课堂教学中,国内比较典型的案例是首都师范大学数字化学习实验室开发的数字化课堂的大数据分析应用,已经在扬州、常州等地中小学的200多个班级进行了多个学期的系统性试点应用,带来了教育效果的明显改变。在数字化课堂教学过程中,对学习过程进行大数据挖掘和分析,教师可以即时进行教学控制和反思,从而提高课堂教学水平,学生也可以及时发现自己学习中的不足,进而提高自己的学习水平。在国内的一些发达城市,如北京、上海、广东等,像在线课程、翻转课堂等网络课程,已经有越来越多的学生和工作者在学习和应用。随着技术的发展,大数据在教育领域有了越来越广泛的应用,学校拥有可用的、高质量的海量数据逐渐成为现实,但如何进行信息挖掘,给未来教育带来更大的可能,也对教育研究者的想象力提出了挑战。苏伽特的一个观点很具有代表性:“你能够想象和确认,你所教的和考核的东西,在今后20年学生们走上工作岗位还管用吗?”为此,苏伽特分析,只有三种最基本的东西在今后的大数据时代是学生要用到的和必须学的东西:“第一是阅读,第二是搜索,第三是辨别真伪。”
大数据时代的到来, 让所有社会科学领域能够借由前沿技术的发展从宏观群体走向微观个体,让跟踪每一个人的数据成为了可能,而对于教育研究者来说,我们将比以往任何时候都更接近发现真正的学生。总而言之,大数据为教育技术的发展带来很多可能性 [6]。
参考文献
[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1):146-169.
[2] 刘怡,李慧君.传播学视野中的大数据与新媒体发展——第二届“新媒体与社会发展”全球论坛暨中英新媒体与社会发展双边对话综述[J].现代传播,2013,(1):141-143.
[3]Nature .Big Data [EB/ OL].http://www.nature.com/news/specials/bigdata/index.html.
[4]魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013,(2).
[5]祝智庭,贺斌.智慧教育:教育信息化的新境界[J].电化教育研究,2012,(12):1~13.
[6]杨妮.美国高中个性化教育策略及其启示[J].教育导刊,2013,(1) .