论文部分内容阅读
校园一卡通系统在高校中的普遍部署,不仅推进了数字化校园的建设,极大地方便了学生的日常生活,也为我们分析学生行为和挖掘学生规律提供了数据基础。然而,许多学校的管理还在沿用传统的学生管理和服务方式,通过专业、年级对学生划分,对学生采用单一化的管理方式,缺乏针对学生行为特征的个性化管理和服务。针对以上问题,本文通过分析高校校园大数据的特点,研究并开发了一个基于Spark平台的学生行为分析与预测系统,主要工作:(1)针对学生行为细分问题,根据可获得的校园数据类型,首先设计了学生行为描述指标体系;然后,设计了基于聚类分析的学生行为细分模型,并对传统的K-means聚类算法从初始聚类中心的选择和聚类数量的确定两个方面进行了改进,提出了一个基于密度优化的K-means改进方法;最后,在Spark平台上对改进方法进行了并行化,并应用于学生行为细分中,对学生进行类别划分,通过实验验证了该划分结果的可靠性。(2)针对学生行为提醒的后置性和时效性问题,本文提出了基于学生行为分层的K近邻非参数回归预测模型,有效解决了K近邻学生预测模型存在的预测误差较大的问题。其次,采用决策树对学生行为的预测结果给予预警分析,实现了学生行为后置性应急到前置性预警引导的转变。最后,针对串行化对海量数据处理的时间复杂度过高问题,设计及实现了上述学生行为预测与预警算法在Spark平台下的并行化,提高了数据处理效率及时间性能。(3)在上述理论研究基础上,设计并实现了基于Spark的学生行为分析与预测应用平台,并详细介绍了Spark大数据平台的构建、系统设计与开发方法。本文所开发的系统可以为学生、学院、学校及后勤管理部门提供学生消费、学习等多方位的行为分析与预测功能,具有较好的实际意义。