论文部分内容阅读
客户识别作为客户关系管理的起始阶段,是客户关系管理中其它环节开展的前提。高效的客户识别模型可以帮助企业准确地找到有价值客户,为企业开展客户关系管理提供有力依据,因此对客户识别模型进行研究对于提高客户关系管理效率就显得尤为重要。可用于客户识别的方法很多,其中最重要的一类方法就是数据挖掘方法。关联向量机是一种新的数据挖掘方法,具有泛化性能良好、概率式预测等优越性,受到了国内外许多学者的青睐,并在许多领域得到了应用,包括电力、生物、水利等。论文首先回顾已有的客户识别模型;针对已有模型的不足引入关联向量机客户识别模型;系统阐述了关联向量机这一新的数据挖掘技术的基本原理,分析了其存在的优劣势;在实例分析中将关联向量机客户识别模型的结果与其它模型结果进行了对比,验证了论文提出的模型的可行性和有效性;最后给出结论。本文将关联向量机引入客户识别研究,贡献如下:1、提出了同分布取样数据降维方法。使用新的平衡数据对RVM模型进行训练时,由于基函数矩阵维数过大导致计算机无法完成运算。因此,需要减少训练集数据量以降低基函数矩阵维度。本文提出采取同分布取样的方法进行降维处理,数据审核结果表明,得到的样本子集同原平衡数据集是同分布的,可以替代原数据集进行模型训练。2、采用实验法确定了模型的基函数。本文分别采用不同的基函数对RVM模型进行训练,验证结果表明采用poly作为基函数时,RVM训练得到的模型的验证精度最高,训练中使用的关联向量数最少。3、将关联向量机数据挖掘技术引入客户识别研究中丰富了客户识别的研究内容,同时将该模型应用于保险业,构建基于关联向量机的保险客户识别模型,实例分析中与其它模型的对比结果验证了该模型的可行性和有效性。