论文部分内容阅读
校园一卡通已经在很多高校得到了广泛的应用,学生在消费过程中产生了大量的数据,这些消费数据中隐藏着大量的信息,对校园一卡通消费数据中隐藏的重要信息的挖掘成为了重要的研究方向。数据挖掘是从海量的数据中发掘隐藏的信息,常用的数据挖掘方法有聚类分析、分类、关联分析等,本文重点研究了聚类算法中的k-means算法,针对算法对初始聚类中心敏感以及各属性权重相同这些不足,提出了基于平均密度与最远距离的加权欧氏距离算法,并将改进算法应用到了校园卡消费数据的聚类中,通过实验验证改进算法具有较高的聚类精度,聚类结果也更加稳定。高校贫困生判定问题是一个长久困扰高校管理的难题,由于助学金的发放关系到贫困生的切身利益,正确识别贫困生就显得尤为重要,挖掘出消费数据中隐藏的信息为贫困生判定提出科学的依据是十分必要的。本文将正常在学校食堂消费(即当月达到一定消费次数)且消费习惯规律、学习成绩优秀的学生作为重点资助对象。由于本文研究的数据来源不同,数据量庞大,对数据的预处理十分必要。在对校园卡数据进行预处理后,对其进行挖掘分析。首先对一卡通的消费数据进行聚类分析,根据聚类结果将学生的消费水平分为三个等级,接着根据学生第一次刷卡时间这一判断标准,分析学生的消费习惯,将学生的消费习惯分为规律和不规律(当月达到一定次数时认为规律,否则不规律),最后跟学生的学习成绩联系起来,得出消费水平、消费习惯和学习成绩相关的数据,得到贫困生的辅助判断的标准,然后对管理者提出科学的决策建议。