论文部分内容阅读
高考是普通高等学校招生全国统一考试的简称,是国家重要的全国性考试之一,是中国公民进入大学学习最重要的桥梁,是全社会关注的重要焦点。高考的整个过程包含两个最重要的环节,就是高考考试和高考志愿填报,本文中的数据挖掘系统支撑下的高考志愿填报在线咨询系统就是作用于高考志愿填报环节。高考志愿填报,是考生根据自己的成绩、志向、爱好等因素,选择自己希望就读的院校和专业,是考生自我意愿的表达。高考志愿填报关系到考生是否能被录取以及是否能录取到满意的院校和专业,它是一个复杂的过程,需要综合考虑考生成绩、院校情况、家庭情况等多种因素。考生和家长极其重视高考志愿填报,往往花费大量精力却又无法准确把握其脉搏。因此,一个有充分招生数据分析做支撑的高考志愿填报在线咨询系统,能够帮助考生和家长对志愿填报进行合理的、恰当的分析,能为考生和家长排忧解难。数据挖掘系统支撑下的高考志愿填报在线咨询系统(以下简称填报咨询系统),旨在帮助考生和家长分析高考志愿填报中存在的客观规律以及潜在影响因素,为考生量身定做相对更加准确的高考志愿填报指导,最大程度降低考生高考志愿填报中的变数。填报咨询系统采用Java EE作为编程平台,使用SSH轻量级企业开发框架,以SQL Server2008作为数据平台。填报咨询系统的特点就是其基于“某省招生数据挖掘系统”平台之上,以院校、专业等维度的挖掘数据作为部分数据来源,因此该系统可以多角度、多层次地进行志愿填报指导,其指导效果也相对更加准确。填报咨询系统基于某省招生数据挖掘系统,从时问跨度上来说,整个项目建设主要分为两个阶段,一是某省招生数据挖掘系统的建设,二是数据挖掘系统支撑下的高考志愿填报在线咨询系统分析、设计与实现。本文将对作者参与的内容进行阐述,概括如下:(1)填报咨询系统的分析、设计与实现:该系统基于某省招生数据挖掘系统,采用Java EE和SQL Server平台,使用了SSH框架,采用WEB服务方式实现数据挖掘接口,并设置了多种缓存方式,包括数据库缓存、页面缓存以及内存缓存。系统可满足高并发性、稳定性和扩展性,可以有效地为考生和家长提供科学的、实用的志愿填报指导。(2)招生数据挖掘系统的建设:招生数据挖掘系统按照实现过程来分,主要有以下几个方面。1、数据的ETL:在先前完成的数据仓库基础上,我们基于SQL Server2008的SQL Server Integration Service,进行数据清洗、转换和装载,导入了十年的招生历史数据,并形成了SSIS项目包,可为后续ETL提供支持。2、多维数据集的建立:在数据仓库之上,我们利用SQL Server Analysis Services针对不同的主题,建立了多个多维数据集,包括有一个全局的多维数据集(含所有维度)和相当的子多维数据集。多维数据集的建立主要为OLAP和报表提供数据支持。3、OLAP和报表的实现:我们基于SQL Server Reporting Services和SQL Server Analysis Services实现OLAP分析和报表的展现,通过对志愿、录取等不同的主题进行具体维度分析,得出相关信息,通过WEB方式展现。4、数据挖掘的实现:数据挖掘基于SQL Server Analysis Services,针对不同的主题应用诸如关联规则、决策树、神经网络等挖掘算法进行数据挖掘,并设计实现了WEB和WIN FORM两套挖掘系统,以满足不同的需求。