论文部分内容阅读
随着网络技术和数据库技术的快速发展,数据供给能力和数据分析能力间的矛盾日益突出,迫切需要一种能够对数据进行深层次加工的自动化技术。数据挖掘技术应运而生。客户分析是当前客户信息管理领域的一个重要发展方向。与数据采集和存储技术飞速发展不相称的是知识获取技术进展的缓慢。知识的自动获取已经成为制约智能诊断发展的“瓶颈”。为此本文对数据挖掘技术及其在客户分析中的应用进行了研究,将数据挖掘技术应用于客户分析并取得了一定效果,在智能分析的知识自动获取方面进行尝试。论文首先分析了客户信息的特点,指出正确设计挖掘算法是数据挖掘技术在客户分析应用中成败的关键。在对现有数据挖掘技术研究和总结的基础上,采用数据挖掘的快速原型处理模型。快速原型处理模型将数据挖掘过程压缩为四个阶段,目的在于尽快看到挖掘结果。再根据结果调整挖掘算法或重新组织数据,从而提高数据挖掘的效率。在快速原型处理模型的基础上,本文对数据挖掘技术及其在客户分析中的应用进行了研究。运用二叉决策树算法,计算了它的VC维上限,并定性地指出:二叉决策树算法的VC维上限随其结果(决策树)复杂度的增大而提高。作为补充,还计算了单变量决策树非叶子节点的VC维上限。基于不同目标,本文还应用了神经网络模型,并对BP算法与Levenberg-Marquardt算法两种算法进行了分析,通过实验对两种算法的效果进行比较。最后本文对客户信息进行了分析,提出一个以数据仓库为核心的客户信息分析、在线预测监测系统方案,为数据挖掘在客户分析中的应用提供了一个数据平台模型。