论文部分内容阅读
数据挖掘(Data Mining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。改革开放30年以来,我国在经济领域取得了取世瞩目的成就,与此同时,世界范围内的信息化革命方兴未艾,利用计算机技术处理数据的能力大幅度提高,对于数据和信息密集的保险行业来说,如何利用海量的业务数据资源,找出内在的市场规律,更好地做出决策和商业规划,提高企业核心竞争力,数据挖掘技术是一种非常好的工具。人寿保险在保险业市场中占有很大比重,激烈的市场竞争使得公司必须不断挖掘自身潜力,提高服务质量;将数据挖掘技术应用到寿险市场的分析中,对发现确定有效的、新颖的、有潜在价值的市场信息或规律,为企业良好经营和决策部门作出重要决策提供支持具有重要意义。本文在数据挖掘理论研究的基础上,阐述了如何根据人寿保险行业的实际情况和需求,将数据挖掘技术应用到寿险市场的分析中。首先,从总体上对数据挖掘技术进行了介绍和把握,介绍了数据挖掘的国内外研究现状、定义及主要特点、分析方法、工作流程及其实现技术等问题,讨论了数据挖掘算法在寿险行业市场分析领域中的应用形式和实施步骤。探讨了数据挖掘系统的一般实现过程和结构。设计实现了一个C/S构架,基于Windows+SQL Server平台的寿险数据挖掘系统LDMS。然后围绕系统核心模块,重点阐述了结合人寿保险行业具体知识如何构建寿险分公司一级寿险数据仓库;详细介绍了关联规则的定义、关联规则挖掘的步骤以及利用Fp-growth算法实现关联规则挖掘、对决策树的优缺点和几种典型算法进行了概括,结合挖掘需求实现了一种可伸缩性决策树分类算法的设计、并对交叉销售的关联规则挖掘结果以及客户细分的分类挖掘结果及其商业理解进行了举例说明,以便能对寿险公司在营销过程中,有针对性地发掘、开发产品、节约成本有所帮助。本文最后对研究工作进行了总结,指出了论文存在的不足之处,同时提出了下一步工作的努力方向。