基于数据挖掘技术的网络故障诊断分析

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:oo789458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:由于数据挖掘技术能够提供各种各样的知识,因而将其应用到网络故障的诊断和分析中可以帮助我们有效解决诊断故障时知识缺乏的现象。本文将从数据挖掘的具体内容出发,讲述将数据挖掘技术应用到网络故障诊断中如何进行数据的选择和预处理,如何对关联规则和聚类方法进行运用。
  关键词:数据挖掘技术;网络故障处理;诊断;分析
  中图分类号:TP393.07
  随着计算机技术的发展,网络在我们的生活和工作中发挥着越来越重要的作用,保持网络技术的安全和高效运转也是计算机行业的重要发展任务。然而,将数据挖掘技术运用到网络故障的诊断中,对于提高诊断的效率,增强其正确性,有着重要的意义,也是当前网络技术研究的热点。
  1 数据挖掘技术
  计算机技术在我们的社会生活中的应用越来越广泛,因而计算机衍生出的人工性智能技术与数据库的技术也随之逐步兴起。同时随之兴起的还有数据挖掘技术。我们通常所讲的数据挖掘技术是指在浩大而又繁杂的各种数据中挖掘出对于我们有利用价值的、有一定意义的数据。近年来,数据的挖掘技术被广泛应用于经济市场中各个领域,无论是市场营销、金融行业、电信行业,还是医药行业、制造行业等等,都会看到数据挖掘技术的应用。
  1.1 数据挖掘技术的特点
  对于数据挖掘技术,其主要特点表现在以下几个方面:第一,数据挖掘的主要对象是各种各样,内容庞大的数据;第二,数据挖掘的结果是不可预知的,多样化,多形式的;第三,数据挖掘的方法是多种多样的,不确定的,对于挖掘过程中技术层面的方法没有最好的,只应挑选最适合的;第四,数据挖掘的技术是综合型多样化的,是技术与学科知识的融合,不仅包含有人工智能的技术,数据库的技术以及可视化的技术等各方面的技术,还包括了哲学、数学以及逻辑学等学科的知识。
  1.2 数据挖掘技术的功能
  数据挖掘技术的过程对外来的行为和发展的趋势进行一定的分析,从而做出一定前瞻性的预测,它的主要功能表现在以下三个方面:
  (1)数据挖掘具有自动进行预测的行为和趋势。数据挖掘技术主要表现在从浩瀚的数据库中寻求有利用价值的信息,改变了以往需要对手头数据和资料进行大量的手工查找和分析的过程,可以在短时间内迅速找到相关结果,得出一定结论。
  (2)数据挖掘技术可进行一定关联分析。在数据库中存在一种十分重要的知识,即数据的关联。关联主要包括有因果、简单和时序三方面。我们进行一定的关联分析,其主要的目的便是找出隐藏于数据库中的关联网。有的时候我们并不知道或者并不确定存在于数据库中相关数据之间是否存在关联函数,因此基于数据挖掘技术的关联分析,其生成规则和整个分析的过程是可信的。
  (3)数据挖掘技术具有聚类的作用。存在于数据库中的各数据信息是可以按照一定的方式被划分成一系列存在一定意义的小子集,这些小子集即聚类。聚类的技术是对概念进行描述核对偏差进行分析的主要条件,它在一定程度上增加了人们认识世界的客观性。
  1.3 数据挖掘技术的主要过程
  (1)确定数据挖掘的主要挖掘对象;(2)准备相关的数据;(3)对转换后的数据进行挖掘;(4)对挖掘的结果进行分析和评估;(5)对知识进行同化。
  将由之前步骤得出的知识进行综合并集成到相关的信息系统结构中。
  2 基于数据挖掘的网络故障诊断分析
  2.1 数据挖掘技术在故障诊断的过程中对数据进行选取以及预处理
  (1)诊断工具对数据的提供。要想基于数据挖掘的基础上对网络的故障进行诊断和分析,首先必须应获得在一定程度上对网络的相关状态进行反映的信息,只有相关网络状态的信息越完整越全面,才能够将有关故障的信息更多的包含在内,才更有利于故障的发现和解决。
  如果要全面获取相关网络信息,我们需要对计算机的网络管理以及网络故障的相关诊断工具进行参考,参考其是怎样提供相关数据的。
  目前情况下,在计算机的网络管理方面,我们普遍采用简单进行网络管理的协议和管理信息的数据库,其中以管理信息的数据库为网络管理数据的主要标准。这项标准同样也规定了进行网络的代理时必须对数据的项目和类型,以及允许操作进行网络的代理。对相关的数据项目进行一定存取的访问,就可得到网络设备中的统计内容。之后可以再对多个相关网络设备统计内容进行综合性分析就可以实现网络的基本管理。因此,要想实现网络管理,其关键便是管理信息的数据库。最常用到的网络故障的诊断工具为协议的分析仪。
  (2)对数据进行选择和进行预处理。由上文对故障诊断的辅助工具以及对网络进行管理的协议的数据选择进行参考,我们在对要进行挖掘的数据定位于数据包的相关统计信息,信息管理数据库的所有变量以及简单管理网络协议中的告警信息。
  对于利用关联的规则进行挖掘的数据,我们采用的是将在同一个时刻下记录的统计信息,管理信息的数据库变量以及简单对网络进行管理的协议中的trap信息作为条目,也就是一条关于事物的数据。
  分类的方法采用的是数据包的统计信息和简单对网络进行管理的协议中trap的信息为一条关于事物的数据。
  聚类的数据采用数据包来进行信息统计,这样子便于对距离的计算。
  2.2 关联规则运用于网络的故障诊断中
  数据挖掘的技术中,关联的规则反映了某些事物之间存在一定的依赖关系或者某种关联的知识,其中如果有两项或者两项以上存在着一定关联,其中的任何一项属性便可根据其他属性进行一定的预测,并且用置信度、支持度以及最小的置信度和最小的支持度这四个相关的参数来确定下一条规定,从而可以根据这项规定将还不知道的障碍数据进行归类。
  然而对网络故障进行诊断时,对一些关联规则的挖掘是有一定困难的。首先,网络故障方面的一些数据是不断随着时间增长的,旧数据与新数据集中混合进行挖掘,会出现工作重复的现象,我们需要在对旧的数据的结果进行充分利用的基础上将新的数据结果进行一定的吸收;其次,网络故障和特征事物彼此间的联系一般情况下联系时间较紧密。很明显,手工对网络故障进行诊断的分析仪器和对网络进行管理的软件提供的都是有时序性的信息,然而传统情况下关联的规则仅表示存在有先后的关系,并没有对时间上的具体情况进行描述。因此,我们需要挖掘网络故障的诊断知识时描述时间上的量变。
  2.3 聚类的方法运用于网络的故障诊断中
  (1)聚类方法的主要内容。顾名思义,聚类指的是通过查找事物之间的相似之处而对事物进行一定的分类。对于聚类的方法和技术的运用也是非常广泛的,无论是在医学方面,还是在模式的识别方面和图像的处理方面。从某种程度上讲,聚类的分析技术就是将一组数据进行分类,使得每一类中数据的相似程度达到最高。
  (2)聚类分析的作用。我们在对网络中的故障进行诊断时,需要在故障发生的网络相关状态用几条收集的数据表达描述,然后提交,有诊断的系统做出相关诊断。然而聚类是将某个数据的集合按照其特点划分成几个特定类别。我们用聚类的方法无法对如此小量的数据得出相关的知识和结论,因而聚类无法完全发挥出它的作用。
  因此我们在对聚类的相关技术进行使用来诊断故障时可以采用样本植入的方法。即先整理一个正确的类聚所有有关样本的故障样本的集合,然后将此时出现故障的数据样本全部植入到此集合中,在进行聚类的操作,获取结果。植入的相关样本在哪一个类别中我们就认为这些样本出现的故障为哪一类。
  3 结束语
  相比与传统的网络故障分析方法,数据挖掘技术有利于问题更高效更全面的解决。然而就我国目前来讲,数据挖掘的技术仍处于起步的阶段,我们仍然需要做出更多的改善和探究,才能使得数据挖掘技术在网络故障诊断中发挥更大的作用。
  参考文献:
  [1]申冰.基于数据挖掘技术的故障诊断系统研究[J].科邯郸职业技术学院报,2008(12).
  [2]周焕银.基于故障诊断的数据挖掘算法研究[J].微计算机信息,2008(1).
  作者单位:江西经济管理干部学院信息工程系,南昌 330088
其他文献
随着现代科技和信息的发展,人类已经进入到了计算机的时代、信息时代。医学领域也不例外,医学图像在计算机的帮助下为现代医疗提供巨大的帮助,也统一了各个厂商的数据的格式,
为研究磁流变阻尼器在汽车振动控制中的应用可行性,对Bouc-Wen磁流变阻尼器模型进行了数值计算分析,揭示了14个参数对模型阻尼力的影响.运用随机理论对Bouc-Wen模型及基于该模型
网络信息技术的不断发展,在很大程度上推动了企业的现代化发展,但同时也让企业面临日益复杂的网络安全问题。本文立足于企业发展现状,阐述了企业网络所面临的安全威胁,并基于
校园网络安全体系的建立能够有效保障学校的教学信息系统、行政管理及信息交换的有序进行。本文在概述校园网络安全技术的基础上,分析了校园网络安全体系的设计,涉及到:网络拓扑
提出了一种新颖的利用5个埋入式应变传感器获得车型特征参数的多传感器行驶车辆分类系统.该系统利用传感器的特殊位置分布与车辆各轴到达传感器时刻的相关性,对采集的信息进行
阐述了基于原子力显微镜(AFM)的弯曲测试测量纳米梁杨氏模量的理论和方法.重点解决了纳米梁杨氏模量测试技术中的3个关键问题:①宽梁条件下杨氏模量理论模型的修正;②纳米梁厚度
针对采用离散变频方式实现三相异步电动机重载软起动过程的一些技术问题进行了分析和研究.首先,分析离散变频软起动过程中分频谐波的影响,表明分频基波产生的转矩达70%以上;
随着计算机技术的不断的发展,计算机不断的被普及,这是一个好的发展现象,然而网络四通八达,包括的更是多不胜数,与世界相联系,所以网络的环境的复杂性还有他的多变性就值得令人所探
经过全校文科广大教师的积极努力,20104度上海师范大学文科高层次项目立项数喜获丰收。其中,国家哲学社会科学基金项目有16个项目获准立项,批准总经费为180万元,立项数创学校历史
现在的计算机出现问题和不安全因素中有很多都是因为网络数据库而造成的,所以网络数据库就是计算机衍生弊端的最重要的因素,网络数据库的不安全才会使计算机面临着各种各样的