数据挖掘在宽带客户报修数据分析中的研究与应用

被引量 : 3次 | 上传用户:LUOMINGGANG818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是解决数据丰富而知识匮乏的有效途径,其实质是从数据库或数据仓库中提取隐含的、未知的有用信息的过程。它被认为是数据库研究中应用前景极其广阔的一个领域。数据挖掘的目的是充分分析和理解数据,寻找数据内部隐藏的知识,并将知识以特定的模式表示出来。在数据挖掘技术的理论研究上,国内外已经取得了令人瞩目的成果;在应用的研究上,数据挖掘技术已经成功的应用到许多商业领域,并获得了良好的商业效益。随着网络技术的发展,企业业务也日益网络化、全球化。网络已经成为企业正常运营中必不可少的工具。因此,网络的性能越来越受到人们的关注。所以,挖掘分析网络报修数据,对于发现网络故障发生的根源、寻找排除故障的最佳途径具有重大意义。对网络服务提供商而言,挖掘分析报修数据,寻找导致故障的关键因素,及时排除导致故障的根源,有助于提高网络性能,树立良好的商业形象;对于网络用户而言,稳定、快速的高性能网络能提高企业的业务效率,增加经济效益。本文首先分析讨论了数据挖掘技术现状及发展趋势、数据挖掘系统的架构、数据挖掘的基本过程、数据挖掘的主要任务、数据挖掘的主要应用领域;然后介绍了决策树的基本概念,研究了决策树的常见算法及其最佳分裂属性选择方法和剪枝算法等。本文中使用的数据来源于上海某网通公司的客户服务部,以SQLServer 2005作为数据存储和管理平台,采用联机分析处理和数据挖掘作为数据分析的手段,运用商业智能平台进行应用程序的开发、展示挖掘结果,完成了基于决策树算法的网络故障报修数据的挖掘与分析。首先,根据业务需求和挖掘对象的特征确定挖掘任务;第二,对源数据进行汇总、清理、转换和消除噪声等数据预处理工作;最后,运用SQL Server 2005数据挖掘组件建立数据源连接、数据源视图,挖掘结构和构建决策树挖掘模型,进行数据挖掘。基于决策树算法的挖掘分析实现了对故障原因和故障类别的分类挖掘,取得了较好的分类效果,并结合网络实际的情况对挖掘结果进行了分析,给出网络维护的建议。
其他文献
背景:冠状动脉性粥样硬化性心脏病(Coronary Heart Disease,CHD),主要是因为黄色粥样脂类物质堆积在冠状动脉,使冠状动脉血管失去原有的弹性,同时因为粥样斑块堵塞冠状动脉血
目的:体外循环(Cardiopulmonary bypass,CPB)下心脏直视手术是目前治疗大部分先天性心脏病、瓣膜性心脏病、冠心病以及大血管疾病的经典手术方法。虽然CPB下心脏直视手术已相
在当今市场经济条件下,核电厂纷纷投入商运,尽最大可能的提高核电厂的经济性,有利于降低核电厂生产成本,提高核电厂的市场竞争力。核电汽轮机的经济性在一定程度上反映了核电
目的:颅内动脉瘤是造成自发性蛛网膜下腔出血的首位病因,占85%,是神经外科常见疾病。AN破裂出血后脑血管痉挛、再出血与急性脑积水是危及生命的并发症,具有较高的死亡率,可高
在灵敏度方法的基础上,以系统当前运行点与最近的电压崩溃点的负荷几何距离作为电压稳定指标,提出了有效提高系统稳定裕度的发电机有功出力调整方案。在开放输电环境下,系统
目的探讨带线锚钉修复踝关节三角韧带Ⅱ、Ⅲ度损伤的方法及临床疗效。方法入选在2012年06月-2013年07月期间治疗的40例患者,经术前或术中探查后确诊为Ⅱ、Ⅲ度的踝三角韧带损
随着集成电路的广泛应用,特征尺寸的不断减小,辐射环境下各种辐射粒子引起的单粒子翻转效应日益严重。研究半导体器件的单粒子翻转效应,提高其抗单粒子翻转的能力,成为近年来
目的:探讨电针联合替扎尼定治疗脊髓损伤后肌痉挛的临床疗效。方法:选取2013年11月至2014年12月因脊髓损伤出现肌痉挛就诊于南京军区福州总医院的病例75例,随机分成3组,治疗组(
目的探讨呼吸道病原体核酸环介导恒温扩增芯片法(LAMP)十三联检在下呼吸道感染常见病原体基因诊断中的价值。方法通过支气管镜下吸痰收集疑似下呼吸道感染患者的深部痰液样本
脊椎疾病是一种常见的老年疾病,在我国的发病率高达百分之九十七。目前,对于脊椎病治疗一般先采用非手术的方法。如果病情比较严重且非手术方法效果不,则采用手术方法。但由