论文部分内容阅读
近年来,随着经济快速发展,客户的消费水平有了明显地提高和突破,这给企业客户关系管理系统存储带来了巨大的压力,尤其是大型零售企业,面对日益膨胀的各种数据资源,面对海量的静态客户信息和动态交易数据,传统的数据库技术已经无法满足现代需求的分析能力,如何发现隐藏在大量数据背后的规则、关系和有价值的知识已成为企业今后研究的重点和难点。随着数据挖掘方法的不断改进和创新,目前也有很多方法在实际应用中已经取得了一定程度的效果,比如决策树方法,神经网络还有贝叶斯方法等等。本文则引入支持向量机的方法应用在大型零售企业客户消费行为分析中,它是在统计学习理论基础上发展起来的一种新的模式识别方法,在解决有限样本,非线性及高维模式识别问题中表现出许多特有的优势。基于以上问题,本文主要研究了以下三方面的内容:第一,阐述了零售业客户消费行为的相关概念、研究现状以及客户分类的研究方法;对消费者的在线消费行为分析后指出网上消费行为将成为今后企业重点关注的内容。第二,对客户消费行为分析中所采用的数据挖掘技术作了重点剖析,尤其详细介绍了支持向量机(SVM)理论,从统计学理论出发,结合最优化和对偶理论对SVM原理、内容和算法作了深入研究;同时也对支持向量、核函数的相关特征以及SVM的优劣势作了对比分析。第三,提出和构建了基于SVM的客户消费行为分析模型—DCSS模型,该模型能较好地处理高维线性不可分问题,采用云状处理过程的映射机制和非确定性推理,将影响分类结果的多属性间的相互关联性较好地体现,结合SVMDT中的概率分布函数,对客户消费数据应用改进的SMO算法产生分类结果。这是本文的核心和重点。文章最后给出了一个具体应用实例,通过对实例的分析和研究,将基于DCSS模型的SMO算法与其它算法进行了比较,结果表明本算法的效率和精度是比较高的,也非常适合于应用在线性不可分的大型零售业客户分类情形中。本文把支持向量机引入零售业客户分类,为企业寻找最优客户提供了一种非常有效的工具。