论文部分内容阅读
近年来,随着手机终端价格和移动通信业务资费的大幅降低,我国移动通信客户数持续高速增长,至2006年底,移动电话客户规模达到4.6亿;与此同时,随着通信技术的日新月异,客户对移动通信产品的消费需求也愈趋复杂多样。显然,面对规模庞大的移动通信客户群体以及巨大的消费需求差别,传统基于人口统计数据的客户细分方法已经难以深入了解客户需求和有效识别高价值的客户。而基于聚类技术的客户细分是通过对蕴含客户消费行为模式的运营数据进行多维分析,可以深入刻画客户消费特征、清晰显示客户消费的差别。该细分方法已经引起市场研究人员的广为认同。
在大量有关基于聚类技术的客户细分的论文中,K均值算法由于原理简单,具有可伸缩性,应用最为普遍。然而,传统K均值算法存在一些缺陷,主要是需人为指定聚类个数、距离度量测度单一和聚类结果易受初始质心的影响等缺陷。这些缺陷严重影响了算法的实际使用效果。基于此,本文首先对K均值聚类算法进行了研究。以K均值算法的三个缺陷为切入点尝试做相应的改进,具体包括尝试利用Ward氏层次聚类算法确定簇个数的方法以及基于四分位相对离差系数的加权方法提高聚类质量;在前人研究初始质心思路的基础上设计实现了二分K均值降低聚类结果易受初始质心的影响,并通过实验数据验证改进效果;在改进方法的基础上提出了一套完整的聚类分析方法流程BKWW(BisectingKMeansbased0nWeightandWards)。然后,本文以移动通信行业为背景,收集了江西某地移动公司的客户资料和消费数据,应用BKWW聚类方法分别对在网和离网客户进行了细分,并将聚类细分结果与传统K均值聚类结果通过凝聚分离系数进行了效果比较,结果表明BKWW聚类方法有效地提高了聚类效果。