论文部分内容阅读
以计算机与网络技术的发展为代表的信息技术的飞速发展,为行业信息化的建设奠定了坚实的基础,同时促进了各行业的信息化进程。银行业是中国最早开始信息化建设,也是最早完成信息化建设的行业之一,具备了完备的数据基础。然而,在对已经掌握的海量数据的分析研究与应用方面,还有许多可以开展的工作,这也成为了目前银行业最为关注的热点。2006年1月央行征信系统的开通运行为银行的贷款决策提供了一定的支持,但其系统功能仅限于业务查询,对征信系统及其数据的利用率较低。银行产品的同质性较为严重,在产品的竞争上优势不大。如何管理客户关系,以及挖掘出隐藏在客户信息背后的业务规律,成为银行业战略决策的一个重要方面。
数据挖掘是一种较新的决策支持技术,具有从海量数据中提取人们未知信息的能力,近年来受到了银行业的持续关注。关联规则是数据挖掘最活跃的研究分支,也是最成熟的数据挖掘技术,在行为分析方面具有独特的优势。基于以上几方面的认识,本文以个人征信数据为平台,对征信数据的关联规则挖掘方法作了较为深入的分析和研究,给出了一类基于属性约束和规则后件约束的挖掘算法AR-RF和规则生成算法RGBAR,据此设计了一个实用的挖掘系统,实现了对征信数据的有效应用挖掘,以期为银行的信用营销管理决策提供理论和实践方面的依据。具体研究内容如下:
1.深入研究关联规则挖掘理论,对关联规则挖掘的算法进行了深入的分析,并就关联规则的优化问题展开深入的讨论。
2.对征信数据进行深入的分析,深入研究了征信数据的基本构成,并就每一构成部分进行详细的功能分析;并对数据的预处理方法进行了分析,为下步的挖掘做初步探索。
3.研究征信数据的整个挖掘过程,针对特定的挖掘任务和挖掘目标,给出了基于属性约束和规则后件约束的挖掘算法AR-RF,并把规则的相关性分析和规则后件约束集成到规则生成算法中,给出了基于规则后件约束的规则生成算法RGBAR,并通过实际的挖掘系统进行了验证。
4.根据挖掘的关联规则进行后处理,并运用信息增益方法,建立了基于信息增益的关联规则决策矩阵模型,并就模型的应用和决策支持展开了较为深入的研究与探讨。