论文部分内容阅读
随着教育信息化的发展,教育大数据越来越受到重视。基于大数据技术来挖掘隐藏的学生活动规律信息,为学生提供更加丰富的“成绩单”,进而刻画学生画像。这对于发现学生的异常行为,改进传统的学生管理模式具有重大的意义。校园一卡通系统实时记录着学生的消费活动数据,为高校数据挖掘提供了极丰富的数据基础。研究者围绕其展开了广泛的研究,主要包括学生饮食习惯分析、异常行为判断、贫困生检测、朋友关系挖掘等,而对学生进行定量研究的较少。现有对学生定量化评价的研究多在心理学及教育学中基于自评量表进行问卷调查,这种方法缺乏实效性。以一卡通数据为基础,对学生活动规律进行定量评价,具有量化、客观、精确、简便等鲜明的特点。考虑到学生活动规律性在消费时间和地点上具有较强的体现,本文利用一卡通消费数据研究了学生的校园消费活动规律。首先,结合人类动力学知识从宏观上分析学生的消费活动数据序列的分布规律及时间特性。其次,依据信息熵原理,通过构造熵聚集函数,提出了一种量化学生消费活动规律的指标——活动熵,并进一步研究了其有效性、分布及其应用。主要工作和创新之处如下:(1)为宏观上把握学生群体的消费活动规律,从人类动力学研究角度出发,研究了学生消费活动数据序列的分布规律及时间特性。研究结果表明:不同年级学生群体早餐消费天数分布服从不同指数的指数分布;学生群体刷卡消费活动间隔时间序列服从头部指数、尾部幂律的组合分布,且具有强阵发弱记忆的特点。(2)基于信息熵理论,结合消费活动数据的特点,构造熵聚集函数,提出了一种对学生校园消费活动规律量化的指标——活动熵(时间活动熵、地点活动熵、时空加权活动熵)以及对应算法,并进一步研究活动熵的有效性及其分布。应用真实熵对学生不同时段的消费地点活动数目进行了预测。(3)进一步挖掘了活动熵的应用。实验结果表明:依据活动熵与其他辅助消费特征可以将学生聚为三类;学生活动熵与学生的早餐消费次数、学习成绩、图书借阅等之间存在强关联性。