论文部分内容阅读
随着国内电信垄断格局的打破,各电信运营商间的竞争也越来越激烈。为了在竞争中争得先机,企业将越来越需要有一套迅速灵敏、功能强大的系统,有针对性地制定政策,适时拿出各种促销手段,能够提供强大的市场分析能力,将大量电信数据转换成可靠的商用决策支持信息的有效解决方案。近年来,电信企业在运营中积累了大量的数据,原来业务系统的关系数据库和传统的数据分析手段只能提供的简单查询和报表,不能获得数据的内在关系和隐含的信息。因此,如何对积累的这些历史数据进行有效的分析,发现知识,用来指导经营决策,已成为电信企业在竞争中制胜的关键。数据仓库和数据挖掘技术的发展为解决这一问题提供了有效途径。数据仓库是一种新型的数据组织及存储方法,它以多维数据建模方式对企业积累的事务型数据重新进行组织,建立新的数据存储,专门用于支持数据分析及企业决策。数据挖掘技术是目前数据仓库领域最强大的数据分析手段。它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则,再利用这些规则为我们所用,如进行预测,为指定决策服务。本文首先阐述了本课题的背景,数据仓库的应用趋势以及研究的目的和内容。接着对数据仓库技术进行了阐述,包括数据仓库、数据挖掘的概念、特征等。然后分析了数据仓库系统在国内电信企业中的应用情况,研究了数据挖掘技术在电信行业中的具体实现。本文研究重点是设计了一套客户流失预测系统,探讨了决策树在电信客户流失预警中的运用情况。主要是针对电信企业的流失客户和没有流失的客户的性质和消费行为,结合数据挖掘方法论,运用决策树算法,建立客户流失预测模型,并针对客户流失模型进行分析,制定相应的营销政策。探讨了决策树的构建原理以及为了防止训练过度而对决策树修剪的理论。文章通过建立客户流失预测模型,分析哪些客户的流失概率大及其相关因素,为市场经营与决策人员制订相应的策略、留住相应的客户提供决策依据。