论文部分内容阅读
数据挖掘是上个世纪90年代初首次被提出的,在短短的时间内得到了迅速的发展,在金融、保险、零售、制造等行业得到了广泛的应用。作为一门交叉学科,它建立在数据库、数据仓库、人工智能、统计学、数据可视化、系统科学等学科基础之上。一般将数据挖掘分为描述数据挖掘和预测数据挖掘两大部分。统计信息系统的发展过程同管理信息系统的发展过程是一致的,同样经历了EDP、MIS、DSS三个阶段,使管理决策不断深化是贯穿于整个发展过程的一条主线。数据挖掘技术的出现对统计信息系统产生了很大的影响,如何将数据挖掘技术应用于统计信息系统中是一个崭新的课题,本文结合“人力资源统计信息系统”的开发,对此进行了探讨。根据用户提出的灵活统计、从数据中发现规律、直观展现数据的需求,应用OLAP、概念描述等描述数据挖掘技术,实现了基本情况分析、分类分析、动态分析、关联分析、特征值分析等一系列功能。利用数据挖掘技术对人力资源数据源中的数据进行统计分析,寻找其中有价值的关系和规律,对人员聘用、培养、选拔等实际工作能够起到一定程度上的辅助作用,并且提供一定的决策支持。在系统开发过程中所遇到的问题,采用的开发思路具有一定的普遍意义,可以在绝大多数统计信息系统中得到应用。本文共分四章。第一章主要介绍了统计信息系统的现状与发展。第二章对数据挖掘进行了概要介绍,包括数据挖掘的定义、层次、数据源、目标以及数据挖掘与统计学的关系等。第三章首先介绍了数据仓库、OLAP与多维分析、OLAP的实施等内容,重点讨论了基于统计数据的OLAP技术。第四章结合“人力资源统计信息系统”,讨论了将描述数据挖掘技术应用于统计信息系统时的一般思路,包括用决策树归纳分类的过程与方法、人力资源统计信息系统结构、系统开发流程、数据挖掘库的建立及决策树算法模块的实现。