论文部分内容阅读
数据挖掘技术是一门运用了人工智能、机器学习、统计学等多个领域理论和技术的新兴交叉学科,可以为企业提取隐含在大量历史数据中,但却潜在有用的信息和知识,从而为决策的制定提供有力的支持。它和数据仓库、联机分析是当前及今后商业智能领域的主流技术。数据仓库集成系统业务数据,面向分析型数据处理,能够简化数据挖掘的某些步骤和提高数据挖掘的效率。联机分析技术则可以为数据挖掘提供预期的挖掘对象和目标,避免挖掘的盲目性。 在国外,数据挖掘已广泛应用于金融、电信、保险、电力等多方面领域,并已经取得显著的成果。将数据挖掘技术有效的应用于银行业是技术发展的方向,也是银行业自身竞争发展的迫切需要。基于这样一种需求,本文对数据挖掘在银行信贷业务中的应用进行了探讨,作了一些有益的实践,并取得了较好的成果。 本文首先介绍了数据仓库、数据挖掘技术相关的概念,然后再分析了现有的信贷管理系统存在的不足之后,针对目前银行业的实际特点,结合实践经验,提出了一个基于数据挖掘的信贷分析系统的设计和实现方法。主要完成了以下工作: 1.了解相关业务知识,根据需求对银行法人信贷业务进行研究。从CMIS系统中抽取与该业务相关的数据,并且通过ORACLE9i在本地创建小型数据仓库平台,建立星型多维数据模型。 2.根据情况采取多种方法,如空缺值填充、噪声数据处理、数据映射、数据概化等,对业务数据进行预处理,提高数据质量,为下一步对业务进行挖掘打下基础。 3.通过具体的数据挖掘实验,对信贷业务数据进行挖掘,并对挖掘结果进行了解释与评估,证明了挖掘模型的可行性和有效性;实现了决策属ID3算法。 最后总结了相关实验体会,讨论了数据挖掘技术应用于国内银行业所碰到的一些难点,并对下一步的工作作了展望。