面向CRM的分类算法及应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:guaiguainiu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库和数据挖掘技术的快速发展,促进着企业决策支持系统的不断更新,也促使企业与客户之间的经济关系发生着重大变革。客户关系管理(CRM)作为近年来数据挖掘技术在企业决策支持系统中又一新的应用,使企业在经营模式、销售战略以及市场服务等多元领域都突破了传统框架。传统的“以产品为核心”的生产经营战略也变革成“以客户为中心”的新型商业模式。客户关系管理中需要理解客户特性和客户行为,利用数据挖掘的分类工具,实现对客户群的认识、分类和评估,然后通过优化服务来实现客户获取、客户保留、客户忠诚和客户盈利的目的。针对客户关系管理中客户分类这一重要环节,作者在分析了现有的数据挖掘分类工具的基础上,采用了决策树分类算法来构造客户分类器。针对多种决策树分类算法存在的不稳定性问题、效率问题和可伸缩性问题,作者采用多属性代替单属性分割的方法来解决决策树的不稳定性,并且结合提高算法效率和可伸缩性的目标,针对SLIQ和C4.5两种算法作了改进和实验。针对SLIQ算法,将单纯利用单属性分割的Gini值作分割指标的方法修改为利用近似最佳分割点和分割谓词的方法,使算法稳定性提高,并且生成的决策树更为紧凑;将驻留内存的散列表用数据库表代替,并且在结构上作了一定的修改,这样可以存储多个最佳近似分割点,从而使算法脱离了内存的限制,提高了可伸缩性;针对C4.5算法,作者为了将不稳定性的改进方法模块化,对C4.5的信息增益的计算作了修改,同时用计数排序代替线性排序来搜索分割点,使算法在时间复杂性上得到一定程度的优化。通过对算法的初步改进,也对决策树算法的不稳定性问题提出了改进的实例,为提高决策树算法稳定性、高效性、可伸缩性提供了一条途径。作者将改进的算法运用于“重庆市移动通信公司话费管理系统”,构造了一个客户分类器,通过对客户属性和业务数据的分类模型建立试验,实现了构建稳定的、可伸缩的分类器的基本目的,从而也证明了针对决策树不稳定性和伸缩性问题的改进的可行性,具有一定的理论价值和实用价值。
其他文献
数据采集系统是工业CT的重要组成部分。如何能够保证数据采集系统工作的稳定、可靠、一致性,对于研制和改进其质量,提高ICT整体性能有着重要意义。重庆大学ICT研究中心经过多年
图形用户界面(Graphics User Interface),简称GUI,即使用图形的方式,借助菜单、按钮等标准界面控件和鼠标操作,帮助用户方便地向计算机系统发出指令,启动操作,并将系统运行的结果同
智能网由智能网平台和业务交换点SSP两部分组成.智能网平台通常由小型计算机及运行在其上的数据库组成.我们可以通过将小型计算机配置为双机系统实现智能网平台设备的可靠性.
“社会网络”是指社会个体成员之间因为互动而形成的相对稳定的关系体系,关注的是人们之间的互动和联系。近年来,新浪微博、Facebook、QQ空间等综合社会应用得到用户的青睐,成为
该文的主要工作分为三个部分:第一部分是关于替身的定义、替身的制作以及应用领域的研究.由于该文提出的系统中替身是非常重要的部分,为了容易理解及制作替身,我们不仅说明了
曲线曲面的生成算法是计算机辅助几何设计的基础,它的每一步改进,对计算机辅助几何设计有着十分重要的意义。本文比较了传统的曲线曲面绘制方法和本文所讨论的算法,指出了传统算
移动通信与Internet是当代通信发展最快的几个领域中的两个,这两者的结合又是当前的一种重要趋向.IPv6作为新一代的网络互联协议,其先进性和灵活性正在得到越来越多人的认可.
该文针对现有的两种主流技术——XML技术和中间件技术,对实现各异构数据库的信息共享做了深入的研究.首先介绍了该课题的背景,包括工程背景和XML和中间件技术的发展现状,指出
随着计算机和网络技术的日益发展,全球上网人数与日俱增,企业上网开展业务成了一种趋势。笔者所在的网络数据库课题组近年来一直致力于基于web应用的开发课题,正是迎合了企事
该文在研究了国际上流行的视频压缩编码标准的基础上,详细的分析了H.26X协议的编解码原理,重点研究此协议的原因.在进行图象编解码的过程中,我们的主要工作是消除视频在空间