通信运营商客户流失预测及影响因素研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:lxlgqm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和通信行业日益饱和的现状,预先预测客户流失并挽留住客户对于通信行业的发展是关键一环。目前,我国刚刚迈入5G时代,通信行业面临着激烈的竞争、产品的同化和其他诸多问题,这些问题导致通信行业的运营商企业存在着严重的客户流失现象。针对这一现象,从海量的客户信息和消费数据中,预测出具有流失倾向的客户及找到影响因素,构建比较完整的流失体系,针对性地给出合理的挽留建议,为客户提供精准的服务和为企业创造更多的收益具有重要的意义。第1章介绍了通信行业某运营商的研究背景及意义。从通信行业运营商的业务收入、使用情况和用户规模出发了解该行业的发展趋势,阐述了论文的研究在新兴技术、互联网发展下对于运营商企业收益方面的意义。并对国内外学者研究客户流失的方法与机器学习的方法发展进行分析。第2章的主要内容是对某运营商的客户数据进行探索性分析。首先,对数据来源进行介绍。其次,对数据进行预处理包括缺失值的处理和变量的变换。最后,对数据进行可视化,查看数据的基本信息特征。第3章利用箱线图法、Spearman相关系数法、假设检验法、基于决策树ID3算法和基于SVM-L1算法筛选了16个重要的自变量,有套餐月资费、电话号码等级、4g非在线计费、4g在线计费、有合约期、无合约期、在网的月数、计费时长、主叫计费时长、上网流量、3G电视费、费用2、上网费、应收费、合约期时长和赠送话费这些变量。第4章利用Boosting算法和生存分析方法建立客户流失预测模型。首先,建立AdaBoost、GBDT、XGBoost、LightBGM、CatBoost客户流失预测模型,选出预测效果最好的CatBoost模型为最优预测模型。其次,为了了解客户流失时间和影响的风险因素,建立生存分析模型。用K-M法画出离散变量的累积生存函数图,直观展示这几个离散型变量对客户生存率的影响。对所有的变量建立Cox比例风险回归模型,分析了影响客户流失的风险因素,有套餐资费、部分电信类型、应收费用和赠送话费。当客户在多种因素影响下,发现客户在使用超过200个月时,生存概率保持0.4左右,达到最低点。最后,基于生存分析模型对CatBoost算法进行改进,将生存分析算法中预测的生存概率代入样本中,用CatBoost进行预测,其准确率、召回率、精确率、F1得分均在0.96左右,提升的预测效果与CatBoost模型相比不是很显著,但其改进后的模型可以提供影响客户流失的风险因素和客户的生存概率,有利于更加详细地了解客户流失的时间和原因。第5章利用系统聚类法对预测流失的客户的变量进行聚类,发现影响客户流失的因素有上网流量、在网时间、应收费用和其他综合因素。结合之前的研究分析,对运营商企业给出相应的挽留客户的建议,帮助企业更好的发展。第6章给出论文研究的结论及展望。首先总结了全文,给出论文的结论。其次对研究中存在的数据收集、算法改进和客户价值挖掘的三个不足的方面进行说明,对未来工作进行展望。
其他文献
宋家营勘查区位于河北唐山丰南区,存在着新生界厚度大,流沙层、卵石层、砂砾层松散破碎,部分钻孔漏失严重;煤层埋藏深、层数多、层位变化大等问题,给提高钻探施工质量和效益带来了
目的:探讨“嗅三针”电刺激对急性局灶性脑缺血再灌注大鼠神经元线粒体保护作用的机理。方法:SD大鼠30只,分为模型组、电针组和对照组。电针组给予“嗅三针”电刺激,疏密波,频
本文从精神分析学角度,重读茹志鹃的小说《百合花》。在对小战士和新媳妇的心理特征作了重点分析之后,进一步探讨了文本的价值问题。该文本在思想上揭示出了崇高背后的暧昧性
“冬病夏治”穴位贴敷疗法是中医的一种独特的外治疗法,它融合了中医学、时间医学、免疫医学等诸多学科的知识,主要在特定的时间段内,即在中国农历的三伏天,采用穴位贴敷的方法,通
目的:探讨自拟养元安胎饮治疗早期先兆性流产的临床疗效。方法:选取80例早期先兆性流产患者,随机分为2组,各40例。治疗组给予养元安胎饮,对照组黄体酮20mg,肌注,每日1次;叶酸5nag/次,3
从压汞试验入手,对淮南煤田煤的孔隙结构随埋藏深度的变化进行分析,根据大量实验数据得到以下认识:随采样深度的增大,煤中总比孔容积呈减小趋势,其中大孔的比孔容积在总比孔容
人民监督员制度的核心内容包括两个方面,一是对“三类案件”的监督,二是对“五种情形”的监督,前者已有了可操作的刚性的监督程序。据统计,自2003年9月开展人民监督员制度试