论文部分内容阅读
随着信息化与数字化校园建设的不断深入发展,校园“一卡通”系统的应用已经渗入到高校大学生的学习、生活等方方面面。在这种背景下,大量的学生的各种活动“痕迹”数据都以文本的方式被完整地记录下来,为我们分析各种学生活动提供了可能。如果我们能利用获得的海量数据,挖掘出学生的行为特点,将无疑为学校的日常管理和决策制定提供重要参考。因此怎样利用这些数据为完善校园相关方面的建设提供有利帮助,是校园卡数据研究的重点方向。目前关于一卡通消费数据的研究集中在通过统计或者数据挖掘的方法来研究学生的消费行为。而大学生在校期间的主要时间是在校内学习和生活,这决定了大学生最重要的行为是“学习行为”和“交往行为”。传统上通过观察、调查问卷等方法来研究学生的行为,但是由于数据的客观性差、数据量小等原因,使得这一问题很难得到满意的解决。能否通过一卡通消费数据来研究学生的“学习行为”和“交往行为”是我们关心的问题。而“学习成绩”和“朋友关系”分别作为“学习行为”和“交往行为”的直接结果,是对它们的重要反映。因此,如何利用一卡通消费数据研究学生的“学习成绩”和“朋友关系”是研究学生的“学习行为”和“交往行为”的重要研究方向。本文基于一卡通消费数据,借鉴了复杂网络的研究方法研究了学生的“学习成绩”和“朋友关系”。本文主要工作如下:(1)细致分析了学生早餐次数与专业成绩之间的秩相关性以及消费时间间隔序列阵发性与专业成绩的秩相关性,并使用机器学习的KNN (K Nearest Neighbor)分类算法对学生的成绩等级进行了预测,取得了很高的准确率。(2)基于一卡通消费数据构建了消费数据的二分网络,并采用多重检验的方法对学生共现是否源于随机相遇进行了统计验证,得到了学生朋友关系网络,然后对所得到的学生朋友关系网络的网络基本特征进行了分析。