论文部分内容阅读
随着大数据、云计算等新技术的不断发展,大数据成为全球范围研究的热点,在多个领域得到了广泛应用,并成为各行业发展的助推器和前进的登高梯。在教育领域中,随着教育信息化水平的快速提高,教育大数据的理念已经深入人心,越来越多的教育工作者和研究者数据需求意识不断增强,期望获取教育数据进行数据挖掘和学习分析。但是,教育工作者和研究者开展数据驱动的教学研究,大多停留在理论和方法层面,主要原因在于,在开展研究过程中没有很好的数据作支撑,缺少便利地获取数据的渠道,导致数据驱动的各项研究进展十分缓慢。针对该问题,本文重点研究了教育数据开放服务模型、架构以及关键技术,并在此基础上,搭建了高校教育数据开放服务系统,为高校教育工作者和研究者提供数据开放服务,解决数据获取不便的难题。首先,从产生数据的主体、数据评价的显性和隐性、数据内容是否具有稳定性三个维度详细阐述了高校教育数据的范畴,结合高校教育数据的范畴和业务特征,提出符合高校特色的数据开放服务模型,并设计了数据开放服务系统的架构。其次,对高校教育数据开放服务过程中的关键技术进行研究,包括:用户需求的理解技术,数据处理和数据分析服务技术,数据对象统一用户标识和数据脱敏技术。针对用户需求的理解,提出需求映射规则模型用来理解用户对公共数据的需求;提出利用语义分析技术理解用户个性化数据需求或对多个数据源综合数据的需求。针对数据处理,采用基于元数据特征提取的方式对数据源中非结构化数据进行结构化处理。针对数据分析,采用社会网络分析方法、K-means聚类算法以及数理统计方法对教育数据进行挖掘与分析。针对数据服务,提出数据服务注册模型,将所有的数据服务接口进行统一管理。针对数据对象统一用户标识,采用学号和教工号对多源异构数据集的记录进行统一用户标识。针对数据脱敏,利用不对称加密算法对用户的敏感信息进行加密。最后,设计并实现了高校教育数据开放服务原型系统,为教育工作者和研究者提供便利获取数据的渠道。