论文部分内容阅读
近几年在参加高考生源人数急剧下降和本科院校的扩招双重影响下,高职院校招生工作日益艰难。传统的招生方式很多凭着优先的经验进行,没有针对性,不能有效节约招生宣传成本。因此,摆在高职院校面前的重要课题是如何利用本学校已有的招生资源信息来促使高职院校在每年的招生宣传、提高考生报到率等方面做出正确的决策本文采用改进的关联规则算法Apriori算法对某高职院校招生系统的历史数据进行了挖掘,找出影响高职院校招生的潜在因素和规则,用来指导高职院校招生工作。本文的主要工作如下:首先,深入分析研究了数据挖掘的经典关联规则Apriori算法,针对Apriori算法在生成频繁项目集时需要多次扫描数据库的问题,给出改进算法。改进算法的主要思想是:将事务数据库中的每条事务增加一项属性列,该属性记录事务中包含的项数量,在计算频繁N项集时,首先比较该属性值与N的大小,如果小于N则将该事务从数据库中删除,该方法降低了扫描事务的数量,提高了生成频繁项集的效率。同时在生成频繁集时,针对用户只关心感兴趣项目的挖掘,剪掉非感兴趣项目的规则,减少了生成频繁集的数目,提高了数据挖掘的时间效率。其次,将改进的Apriori算法应用在某高职院校的招生数据分析中。包括对高职院校的招生数据进行属性选择、数据转换和数据集成等预处理。并应用改进的Apriori算法对预处理后的数据进行了关联规则的挖掘,并给出了挖掘结果。最后对部分挖掘结果进行了分析,并对此高校今后的招生工作提出了合理化建议。