论文部分内容阅读
随着电子商务普及的范围越来越大,数量越多,发展越来越快,各电子商务企业间的竞争也越来越大、越演越烈。众所周知,电子商务企业最重要的就是客户,客户可以分为新客户和老客户。很多研究结果都表明,保留老客户所需的成本比发展新客户要低很多,并且老客户为企业带来更高的利润。所以在电子商务领域,对客户流失情况进行分析,预测出可能会流失的客户,进而采取相应的措施对这部分客户进行挽留,避免其流失具有非常重要的意义。现在大部分电子商务企业都已对客户的基本特征信息和交易行为等数据进行了深入分析,然后再利用各种方法和技术建立和研究客户流失预测模型,最后以此来对客户流失情况进行预测。数据挖掘技术已经广泛运用到电子商务企业的客户关系管理中,如客户细分、客户流失预测、提及欺诈分析等。以往的有关客户流失的预测研究基本上都是针对实体企业的,如中国电信、银行等,专门针对电子商务进行客户流失的研究相对较少。已有的电子商务客户流失研究很多都基于客户特征信息如客户的年龄、性别、年收入等来做的,由于电子商务的客户具有虚拟化不可见的特点,这些客户统计信息根本无法得到。本文主要收集电子商务的客户交易数据,针对此数据运用数据挖掘技术建立电子商务客户流失模型,让企业能够及时了解到客户动态,掌握客户流失规律,从而据此制定合适的客户保持策略,以在当前电子商务的激烈竞争处于优势地位。在本次研究过程中,本次首先对客户流失以及电子商务领域的客户流失的国内外现状进行了分析。其次,对数据挖掘理论和方法以及客户流失常用挖掘算法Logistic回归和神经网络进行了系统的整理和概述,为后续的研究做好了理论准备。再次,本文对SMC模型进行了详细的介绍,并基于此给出了电子商务客户潜在价值的计算方法。然后再进行数据收集、数据准备、指标选择等工作。最后使用SPSS Clementine数据挖掘软件建立了三种预测模型:一是采用Logistic二项回归直接建模;二是采用神经网络建立模型;三是基于客户潜在价值使用神经网络建立模型,这里详细介绍了使用SMC模型计算客户潜在价值的步骤并验证了SMC模型在电子商务领域的使用性。对于建立的三个模型,本文分别进行了模型评估和结果分析。本次研究取得了很好的客户流失预测效果,所建立的三个电子商务客户流失模型都有着较好的预测正确率,神经网络比Logistic二项回归更适用于电子商务企业客户流失预测模型,并且基于客户潜在价值的客户流失模型具有更高的预测正确率。