大数据驱动的投诉预测模型研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:jnyinli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电信行业市场竞争的不断加剧,用户维权意识的不断提高,各大运营商用户投诉量日益攀升。在此情况下,如何减少用户投诉量成为运营商关注的焦点。为了减少用户的投诉量,一方面可以从运营商自身出发,不断提高电信产品服务质量。另一方面可以从预测用户投诉行为入手,通过数据挖掘模型来预测未来可能会投诉的用户,分析其投诉原因。针对这些潜在投诉用户提前制定不同的营销方案,使得运营商在处理投诉问题时由被动变为主动,从而大幅度的降低用户投诉量。但是,传统投诉预测模型普遍存在以下几个问题:(1)模型输入的数据大多采用相对容易获得的业务支持系统(Business Support System,BSS)数据,而没有充分利用电信运营商的运营支持系统(Operation Support System,OSS)数据。然而融合BSS和OSS数据构成电信大数据可以设计出更加精确的投诉预测模型;(2)没有基于电信大数据设计出有效的特征及选择合适的算法分类器来进行投诉预测;(3)不能自动从电信大数据中捕捉到一些非线性的组合特征来提高模型的预测精度;因此,如何高效的利用大数据技术解决电信投诉预测问题是一件非常具有意义的工作。本文首先构建了基于Hadoop/Spark的电信大数据平台,并提出了使用并行随机森林(Parallel Random Forest,PRF)构建用户投诉预测模型。该方法不仅用到了BSS数据,而且还用到了OSS数据和客服工单数据(Customer Service Records,CSR),并选用合适的特征工程方法从这些数据中提取出BSS特征、OSS特征和CSR特征。最后利用网页排序算法(Page Rank,PR)、标签传播算法(Label Propagation,LP)和因式分解机算法(Factorization Machine,FM)自动提取出了反映用户间相互关系的图特征和特征间的二阶组合特征。为了自动捕捉一些非线性特征,本文提出了基于卷积神经网络(Convolutional Neural Networks,CNN)的投诉预测模型和基于深度置信网络(Deep Belief Networks,DBN)特征学习的投诉预测模型。由于CNN输入特征顺序的特殊性,本文采用了基于矩阵分解(Matrix Factorization,MF)特征相似度排序的方法对输入特征顺序进行了重排序,即将相似度联系最大的特征尽量放在一起。由于DBN模型效果对隐层相关的初始化参数十分敏感,本文通过大量实验对比,对隐层层数、每层节点数和模型迭代次数这三个模型初始化参数进行了最优选择。最终运用深度多层网络模型从原始特征中自动学习到了适合分类器分类的非线性组合特征表示,将其输入到传统分类器中,实验结果显示该方法不但能提升分类的精度,而且能避免人工特征工程过程中难以预估的复杂性等缺陷。本文以上海市某运营商中1032945个真实用户历史数据作为训练样本,其中正负样本比例为1:3。实验结果表明,本文提出的PRF算法与构建的图特征和二阶组合特征比以往研究的投诉预测模型运行速度更快,精度在AUC指标上提升了5.2%。本文基于CNN和DBN的预测模型相比传统预测模型在AUC指标上也分别提升了2.9%和7.1%。这充分证实了本文从人工特征工程方法和深度学习方法两方面提取特征的有效性,也从侧面证实了深度学习特征学习单元在电信大数据领域的可用性,为电信大数据在其它应用领域提供了指导性的建议。
其他文献
水稻是最主要的粮食作物之一,世界上超过50%的人口以稻米为主食。提高水稻产量对保障粮食安全至关重要。理想株型育种是提高单产的重要途径之一,而窄叶性状是水稻理想株型的重要的指标。因此,对水稻窄叶性状进行深入的遗传机理分析,寻找新的等位基因对培育具有理想株型的水稻新品种具有重要的理论意义。本实验在9311辐射诱变的突变体库中发现一个叶片显著变窄的突变体,暂命名为nal7-2(t)。对nal7-2(t)
本试验旨在从绵羊的生长性能、营养物质消化率、氮代谢率、瘤胃发酵、瘤胃菌群、血液生化指标方面,探究不同含量草酸对绵羊生长消化、血液指标、瘤胃功能的影响。采用单因素试验设计,选取24只德国肉用美利奴绵羊(32.08±3.43 kg BW),随机分成3个处理,每个处理8个重复,每个重复1只羊,试验处理分别在日粮中以草酸(H2C204)形式添加1%(T1组)和2%(T2组)的草酸,对照组不添加。正式试验期
Soil and water conservation(SWC)practices have been long-time recognized as a tackle to soil erosion,and maintain sustainable agriculture on sloping farmland.Non-point source pollution has become one
随着我国高速铁路建设的不断发展,各高速铁路车站也都建立了相应的旅客服务系统和平台,满足了当时的旅客服务需求,同时各个子系统之间,例如:广播、综显、安检、售票、查询、旅客服务等系统也都实现了各自的功能,实现了车站的运转,满足了旅客出行的基本需求,为我国高铁事业的发展奠定了良好的基础。但是我国的铁路旅客服务理念还存在固有的僵化,没有树立以市场为导向的服务意识;同时在旅客服务平台的软、硬件设施上还有待加
萨拉·凯恩(1971-1999)的作品经历了风格和主题上的转变。相较于直接呈现暴力场景的前期剧作《摧毁》和《清洗》,其后期作品《渴求》和《4.48精神崩溃》有着更破碎、抒情的风格,也更重视个体的精神世界。理解这一转变有助于把握凯恩的整体创作,但现有研究对此关注较少。本文借助费尔曼的证言理论,将凯恩的转变解读为她在经历创伤见证的危机之后、对创伤表现方式的新探索。通过分析凯恩在不同创作阶段的技巧和主题
本文从中菲关系的视角切入,探析中菲政府如何以及为何发现与重构“苏禄王遗存”在双边关系中的价值,使用层次分析法、案例分析法、历史分析法来阐述这一“前因后果”。论文重点关注的并非“苏禄王遗存”对中菲关系的影响,而是“苏禄王遗存”所发挥的影响与价值被发现、被重构的过程。“苏禄王遗存”是指有关苏禄王访华的古籍记载和历史传说、苏禄王墓、苏禄王后裔。“苏禄王遗存”在中菲关系中的价值被挖掘出来之前,中国政府将苏
目的:肾脏纤维化是以细胞外基质(Extracellularmatrix,ECM)的过度积聚和沉积为主要病理特征的一种肾脏病理损害,是各种慢性肾脏病(Chronic kidney disease,CKD)进展至终末期肾脏病(End-stage kidney disease,ESKD)的共同通路。其发病机制复杂,无有效的防治措施。我们前期研究发现,WNT1诱导信号通路蛋白1(WNT1-inducibl
从2012年以来,我国的经济和消费的增速一直放缓,再加上电商兴起而对传统零售企业的冲击,传统零售业门店关闭的现象频繁出现。自2015年开年以来,全国百家重点大型零售企业的总
目的:通过构建Bmal1基因不同表达状态的鼻咽癌细胞株CNE1,对比放疗前后通路相关蛋白表达水平变化情况,从分子水平上探讨放疗后生物钟基因Bmal1能否通过ATM/ATR通路调控细胞周期相关蛋白及其作用机制。方法:构建鼻咽癌细胞株CNE1,通过慢病毒载体转染构建Bmal1基因过表达组,其空载体转染为对照组,在过表达组中加入ATM/ATR通路抑制剂KU55933作为抑制剂组,将未做处理的CNE1细胞
本翻译实践报告材料选自法学家Alfred Phillips于2003年出版的法律语言学著作Lawyers’Language。本书详细地阐述了普通语言是如何转化为律师语言的以及通过举例证明了律师语言的正当性,因此非常具有研究价值。在本次翻译报告写作中,主要以Lawyers’Language(Chapter 5)为例,探讨研究英汉衔接手段的翻译策略。通过对原语的全面分析,其语篇特征多表现为照应、替代与