数据挖掘在电信行业客户价值提升中的应用

来源 :中国信息化·学术版 | 被引量 : 0次 | 上传用户:nallysun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】本文在研究数据挖掘目前在电信业已有应用的基础上,结合客户价值理论,提出对中高端客户实施价值提升的研究方案,利用CRISP-DM标准方法和C5.O算法建立了价值提升客户模型,并将模型应用于移动某分公司的客户关系管理系统,取得了良好的实际应用效果。
  【关键词】电信行业;数据挖掘;客户价值;C5.0算法
  【中图分类号】F62 【文献标识码】A 【文章编号】1672-5158(2012)09-0061-02
  一、引言
  近年来,随着电信市场的不断开放,电信行业的竞争也日趋激烈。各大运营商都在竭力寻求在提升服务质量、下调资费的同时,又保持收入平稳、提高的方法。数据挖掘无疑是帮助企业有效分析客户数据,提升企业竞争力的有力工具。数据挖掘能够于从海量数据中挖掘出隐含在其中的矿藏——知识。它以现实数据为依据,以信息技术为手段,通过对大量数据进行统计、分析、综合和推理,来指导对实际问题的求解,并能对未来的发展趋势做出预测。
  目前,数据挖掘在电信业中的应用主要有:分析市场状况,制定营销策略,进行客户细分和针对性营销,开展客户流失预警和客户保持。本文在借鉴以上这些做法的基础上,基于帕累托所谓“关键的少数与次要的多数”的关于市场分布的一般规律,提出对中高端客户进行价值提升的方法与应用。为移动通信类企业在解决竞争加剧、资费下调与保持收入持续增长的矛盾中,提供了一条新的解决思路。
  二、客户价值提升方案
  本次挖掘简言之就是发现有价值提升潜力的中高端客户进而实施客户价值提升。具体做法为,利用移动某分公司现有的的数据仓库,运用数据挖掘工具SPSSClementine找出有价值提升潜力的中高端客户,再借助企业营销管理平台对其开展针对性营销,以帮助企业充分发掘中高端客户存量市场的潜力。
  三、基于clementine的价值客户挖掘
  1.业务理解
  本文的中高端客户指高ARPu值(ARPU-Average Revenue PerUser,用户平均收入)和高MOU值(MOU—minutes ofusage,用户通话时长)的客户。ARPU值和MOU值分别指客户的月消费金额和月通话时长,它们是反映客户消费行为的两个重要指标。因此,本次挖掘将中高端客户定义为:月ARPU值不低于120元,且当月主叫MOU值不低于100分钟的月末在网客户。
  2.建立模型
  本次建模选择决策树中的C5.0算法。C5.0算法是C4.5算法的商业化版本,它采用信息增益比例选择分割属性,是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面做了改进,同时提高了分类精度。使用C5.0算法主要考虑了以下几点:
  1)本次建模的预测目标变量Flag Tag,它只有两种结果,是典型的离散型变量,适合于决策树分类;
  2)参与建模的变量很多是连续型字段,如本月消费值、本地通话时长、本地通话费等,要考虑能处理连续属性的算法;
  3)从模型的建模速度和准确率角度看,C5.0算法的分类速度较快且准确率较高;
  4)从模型的可解释性和实用性角度考虑,C5.0算法也是很容易理解、解释和指导实践的算法。
  采用C5.0算法建立价值提升客户分类模型,其目标字段为Flag Tag,输入字段为前面经过变量选择筛选出的字段。建模流程图如图2:
  经过反复训练,比较模型评价结果,最终模型参数设置如图3:参数设置说明:
  1)设置输出类型为“决策树”,便于了解模型预测过程,发现对预测起关键作用的变量和分割点;
  2)选择“使用推进”,将实验次数设为3,推进是C5,0算法特有的技术,通过他能显著提高模型精确度,但也会增加模型训练的时间。
  3)将参数设置模式选择为“专家”,并设置“每个子分支的最小记录数”为200,这样在兼顾模型准确率的同时能避免过度拟合和决策树深度过深。
  此外,在判断一个用户是否为价值提升客户时,将没有价值提升潜力的客户误打为T和将有价值提升潜力的客户误打为F,两者给电信带来的损失是不同的,为增强对价值提升客户的覆盖率,加入误分类损失,将T打为F的误分类成本由1提高到2。执行生成C5.0模型。
  4、模型结果及评价
  经过模型数据的多次筛选及调整,最终模型整体准确率达93.21%。将模型应用于测试样本,通过建模找到的前18%的客户就占到总体价值提升客户数的98.5%(如图4),可见建模收益还是很好的。
  5、模型实施
  将模型應用于企业营销管理平台,由营销模型库对模型产生的目标客户进行营销套餐匹配,进而指导外呼人员开展针对性营销。从表1客户营销执行结果中可以看到,在外呼接通客户数上,通过模型挖掘找到的客户其外呼接通率略大于随机抽取的客户,在营销成功比例上,模型挖掘客户的营销成功率远远高于随机抽取的客户,甚至能达到6倍,可见,本次数据挖掘的结果对营销执行是很有意义的。
  四、结束语
  本文将数据挖掘技术应用于电信业的客户价值提升中。基于客户价值分布理论,提出对中高端客户实施价值提升的方案,采用C5.0算法实现了价值客户挖掘,并通过营销执行,有效实现了中高端客户的价值提升,进一步验证了对中高端客户实施价值挖掘的可行性和有效性。为移动通信类企业在解决竞争加剧、资费下调与保持收入持续增长的矛盾中,提供了一条新的解决思路。
其他文献
国外文献大量去酸法可分为两类:第一类是碱性气体去酸;第二类是碱性蒸气去酸;第三类是碱性溶液去酸。这三类方法在文献保护工作中有重大的作用。一、碱性气体去酸1.二乙基锌
随着风电产业的不断发展,人们对风机性能检测越来越重视,中国电力科学院建立了具有国际互认资质的风机性能检测中心.各省都在陆续建立检测中心,而风机载荷检测分析是各项检测
【中图分类号】TP27 【文献标识码】A 【文章编号】1672-5158(2012)09-0056-01  空管自动化系统是民航空管部门实施对空指挥的核心系统,它能为管制员提供實时、精准的飞行动态和航班计划。在自动化系统中,FDP服务器主要是负责完成飞行电报处理、飞行计划处理、航班相关数据管理、飞行计划冲突探测、飞行计划与系统航迹相关等功能。  青岛目前使用的自动化系统为南京莱斯公司生产的NUMA
期刊
【中图分类号】V443 【文献标识码】A 【文章编号】1672-5158(2012)09-0057-01  1、引言  目前,各种先进的电子设备被广泛应用,因其大量使用大规模集成元器件,对过电压干扰十分敏感,尤其是雷击过电压。雷击过电压是指由于雷电直接击中各种金属线路;或雷击接闪器时由于电阻耦合、电容耦合、电感耦合等将高电位引入电子设备;或由于接地系统的不规范,雷电流入地时各地问的地电位不均衡等原
期刊
随着我国用电总量的激增,我国电力系统的压力也随之增大,为此,在现有基础上逐渐完善变电站的自动化工作进程,是提高电力系统运作质量,保证百姓安全稳定用电的基础,本文从我国
为贯彻落实国务院和国家档案局,全国各级档案行政管理部门相继开展了执法责任制工作.但各地的具体情况不同,工作方法各异,在取得一定成绩的同时,也暴露出诸多问题.不利于执法
【摘要】本文论述了供电企业以提高供电可靠率为总抓手对供电企业的影响,提出了供电企业工作和管理方向的建议。  【关键词】电网;供电可靠性;管理;影响  【中图分类号】U223.6 【文献标识码】A 【文章编号】1672-5158(2012)09-0058-02  前言  供电可靠率直接体现了供电系统对客户的供电能力,是衡量供电企业运营、管理和服务水平的重要指标。供电可靠率指标体系是供电系统规划设计、
变电站综合预警防护监视终端,该终端使用CAN总线通信协议,采用分布式数据采集方式和开放式结构,是一种全新的数字化终端.重点论述了该终端的工作原理、系统实现目标以及系统
杂志是根据老一辈无产阶级革命家彭真的提议,于1994年7月创办的,至今已走过10年战斗历程.中国延安精神研究会已故会长马文瑞对杂志一直关怀备至,不仅对办刊方向提出了重要的
【摘要】本文将分别叙述在智能自动化环境下的智能仪表、自动化精度测试系统的优化和以FLuK8845A为具体智能仪表实例,应用到自动精度测试系统当中,对自动精度测试系统当中的系统构造、输入电路接口的设计等的具体操作做详细的解说。  【关键词】智能仪表;自动精度测试系统;解析应用;智能自动化  【中图分类号】F407.67 【文献标识码】A 【文章编号】1672-5158(2012)09-0062-02