论文部分内容阅读
摘 要:由于数据挖掘技术能够提供各种各样的知识,因而将其应用到网络故障的诊断和分析中可以帮助我们有效解决诊断故障时知识缺乏的现象。本文将从数据挖掘的具体内容出发,讲述将数据挖掘技术应用到网络故障诊断中如何进行数据的选择和预处理,如何对关联规则和聚类方法进行运用。
关键词:数据挖掘技术;网络故障处理;诊断;分析
中图分类号:TP393.07
随着计算机技术的发展,网络在我们的生活和工作中发挥着越来越重要的作用,保持网络技术的安全和高效运转也是计算机行业的重要发展任务。然而,将数据挖掘技术运用到网络故障的诊断中,对于提高诊断的效率,增强其正确性,有着重要的意义,也是当前网络技术研究的热点。
1 数据挖掘技术
计算机技术在我们的社会生活中的应用越来越广泛,因而计算机衍生出的人工性智能技术与数据库的技术也随之逐步兴起。同时随之兴起的还有数据挖掘技术。我们通常所讲的数据挖掘技术是指在浩大而又繁杂的各种数据中挖掘出对于我们有利用价值的、有一定意义的数据。近年来,数据的挖掘技术被广泛应用于经济市场中各个领域,无论是市场营销、金融行业、电信行业,还是医药行业、制造行业等等,都会看到数据挖掘技术的应用。
1.1 数据挖掘技术的特点
对于数据挖掘技术,其主要特点表现在以下几个方面:第一,数据挖掘的主要对象是各种各样,内容庞大的数据;第二,数据挖掘的结果是不可预知的,多样化,多形式的;第三,数据挖掘的方法是多种多样的,不确定的,对于挖掘过程中技术层面的方法没有最好的,只应挑选最适合的;第四,数据挖掘的技术是综合型多样化的,是技术与学科知识的融合,不仅包含有人工智能的技术,数据库的技术以及可视化的技术等各方面的技术,还包括了哲学、数学以及逻辑学等学科的知识。
1.2 数据挖掘技术的功能
数据挖掘技术的过程对外来的行为和发展的趋势进行一定的分析,从而做出一定前瞻性的预测,它的主要功能表现在以下三个方面:
(1)数据挖掘具有自动进行预测的行为和趋势。数据挖掘技术主要表现在从浩瀚的数据库中寻求有利用价值的信息,改变了以往需要对手头数据和资料进行大量的手工查找和分析的过程,可以在短时间内迅速找到相关结果,得出一定结论。
(2)数据挖掘技术可进行一定关联分析。在数据库中存在一种十分重要的知识,即数据的关联。关联主要包括有因果、简单和时序三方面。我们进行一定的关联分析,其主要的目的便是找出隐藏于数据库中的关联网。有的时候我们并不知道或者并不确定存在于数据库中相关数据之间是否存在关联函数,因此基于数据挖掘技术的关联分析,其生成规则和整个分析的过程是可信的。
(3)数据挖掘技术具有聚类的作用。存在于数据库中的各数据信息是可以按照一定的方式被划分成一系列存在一定意义的小子集,这些小子集即聚类。聚类的技术是对概念进行描述核对偏差进行分析的主要条件,它在一定程度上增加了人们认识世界的客观性。
1.3 数据挖掘技术的主要过程
(1)确定数据挖掘的主要挖掘对象;(2)准备相关的数据;(3)对转换后的数据进行挖掘;(4)对挖掘的结果进行分析和评估;(5)对知识进行同化。
将由之前步骤得出的知识进行综合并集成到相关的信息系统结构中。
2 基于数据挖掘的网络故障诊断分析
2.1 数据挖掘技术在故障诊断的过程中对数据进行选取以及预处理
(1)诊断工具对数据的提供。要想基于数据挖掘的基础上对网络的故障进行诊断和分析,首先必须应获得在一定程度上对网络的相关状态进行反映的信息,只有相关网络状态的信息越完整越全面,才能够将有关故障的信息更多的包含在内,才更有利于故障的发现和解决。
如果要全面获取相关网络信息,我们需要对计算机的网络管理以及网络故障的相关诊断工具进行参考,参考其是怎样提供相关数据的。
目前情况下,在计算机的网络管理方面,我们普遍采用简单进行网络管理的协议和管理信息的数据库,其中以管理信息的数据库为网络管理数据的主要标准。这项标准同样也规定了进行网络的代理时必须对数据的项目和类型,以及允许操作进行网络的代理。对相关的数据项目进行一定存取的访问,就可得到网络设备中的统计内容。之后可以再对多个相关网络设备统计内容进行综合性分析就可以实现网络的基本管理。因此,要想实现网络管理,其关键便是管理信息的数据库。最常用到的网络故障的诊断工具为协议的分析仪。
(2)对数据进行选择和进行预处理。由上文对故障诊断的辅助工具以及对网络进行管理的协议的数据选择进行参考,我们在对要进行挖掘的数据定位于数据包的相关统计信息,信息管理数据库的所有变量以及简单管理网络协议中的告警信息。
对于利用关联的规则进行挖掘的数据,我们采用的是将在同一个时刻下记录的统计信息,管理信息的数据库变量以及简单对网络进行管理的协议中的trap信息作为条目,也就是一条关于事物的数据。
分类的方法采用的是数据包的统计信息和简单对网络进行管理的协议中trap的信息为一条关于事物的数据。
聚类的数据采用数据包来进行信息统计,这样子便于对距离的计算。
2.2 关联规则运用于网络的故障诊断中
数据挖掘的技术中,关联的规则反映了某些事物之间存在一定的依赖关系或者某种关联的知识,其中如果有两项或者两项以上存在着一定关联,其中的任何一项属性便可根据其他属性进行一定的预测,并且用置信度、支持度以及最小的置信度和最小的支持度这四个相关的参数来确定下一条规定,从而可以根据这项规定将还不知道的障碍数据进行归类。
然而对网络故障进行诊断时,对一些关联规则的挖掘是有一定困难的。首先,网络故障方面的一些数据是不断随着时间增长的,旧数据与新数据集中混合进行挖掘,会出现工作重复的现象,我们需要在对旧的数据的结果进行充分利用的基础上将新的数据结果进行一定的吸收;其次,网络故障和特征事物彼此间的联系一般情况下联系时间较紧密。很明显,手工对网络故障进行诊断的分析仪器和对网络进行管理的软件提供的都是有时序性的信息,然而传统情况下关联的规则仅表示存在有先后的关系,并没有对时间上的具体情况进行描述。因此,我们需要挖掘网络故障的诊断知识时描述时间上的量变。
2.3 聚类的方法运用于网络的故障诊断中
(1)聚类方法的主要内容。顾名思义,聚类指的是通过查找事物之间的相似之处而对事物进行一定的分类。对于聚类的方法和技术的运用也是非常广泛的,无论是在医学方面,还是在模式的识别方面和图像的处理方面。从某种程度上讲,聚类的分析技术就是将一组数据进行分类,使得每一类中数据的相似程度达到最高。
(2)聚类分析的作用。我们在对网络中的故障进行诊断时,需要在故障发生的网络相关状态用几条收集的数据表达描述,然后提交,有诊断的系统做出相关诊断。然而聚类是将某个数据的集合按照其特点划分成几个特定类别。我们用聚类的方法无法对如此小量的数据得出相关的知识和结论,因而聚类无法完全发挥出它的作用。
因此我们在对聚类的相关技术进行使用来诊断故障时可以采用样本植入的方法。即先整理一个正确的类聚所有有关样本的故障样本的集合,然后将此时出现故障的数据样本全部植入到此集合中,在进行聚类的操作,获取结果。植入的相关样本在哪一个类别中我们就认为这些样本出现的故障为哪一类。
3 结束语
相比与传统的网络故障分析方法,数据挖掘技术有利于问题更高效更全面的解决。然而就我国目前来讲,数据挖掘的技术仍处于起步的阶段,我们仍然需要做出更多的改善和探究,才能使得数据挖掘技术在网络故障诊断中发挥更大的作用。
参考文献:
[1]申冰.基于数据挖掘技术的故障诊断系统研究[J].科邯郸职业技术学院报,2008(12).
[2]周焕银.基于故障诊断的数据挖掘算法研究[J].微计算机信息,2008(1).
作者单位:江西经济管理干部学院信息工程系,南昌 330088
关键词:数据挖掘技术;网络故障处理;诊断;分析
中图分类号:TP393.07
随着计算机技术的发展,网络在我们的生活和工作中发挥着越来越重要的作用,保持网络技术的安全和高效运转也是计算机行业的重要发展任务。然而,将数据挖掘技术运用到网络故障的诊断中,对于提高诊断的效率,增强其正确性,有着重要的意义,也是当前网络技术研究的热点。
1 数据挖掘技术
计算机技术在我们的社会生活中的应用越来越广泛,因而计算机衍生出的人工性智能技术与数据库的技术也随之逐步兴起。同时随之兴起的还有数据挖掘技术。我们通常所讲的数据挖掘技术是指在浩大而又繁杂的各种数据中挖掘出对于我们有利用价值的、有一定意义的数据。近年来,数据的挖掘技术被广泛应用于经济市场中各个领域,无论是市场营销、金融行业、电信行业,还是医药行业、制造行业等等,都会看到数据挖掘技术的应用。
1.1 数据挖掘技术的特点
对于数据挖掘技术,其主要特点表现在以下几个方面:第一,数据挖掘的主要对象是各种各样,内容庞大的数据;第二,数据挖掘的结果是不可预知的,多样化,多形式的;第三,数据挖掘的方法是多种多样的,不确定的,对于挖掘过程中技术层面的方法没有最好的,只应挑选最适合的;第四,数据挖掘的技术是综合型多样化的,是技术与学科知识的融合,不仅包含有人工智能的技术,数据库的技术以及可视化的技术等各方面的技术,还包括了哲学、数学以及逻辑学等学科的知识。
1.2 数据挖掘技术的功能
数据挖掘技术的过程对外来的行为和发展的趋势进行一定的分析,从而做出一定前瞻性的预测,它的主要功能表现在以下三个方面:
(1)数据挖掘具有自动进行预测的行为和趋势。数据挖掘技术主要表现在从浩瀚的数据库中寻求有利用价值的信息,改变了以往需要对手头数据和资料进行大量的手工查找和分析的过程,可以在短时间内迅速找到相关结果,得出一定结论。
(2)数据挖掘技术可进行一定关联分析。在数据库中存在一种十分重要的知识,即数据的关联。关联主要包括有因果、简单和时序三方面。我们进行一定的关联分析,其主要的目的便是找出隐藏于数据库中的关联网。有的时候我们并不知道或者并不确定存在于数据库中相关数据之间是否存在关联函数,因此基于数据挖掘技术的关联分析,其生成规则和整个分析的过程是可信的。
(3)数据挖掘技术具有聚类的作用。存在于数据库中的各数据信息是可以按照一定的方式被划分成一系列存在一定意义的小子集,这些小子集即聚类。聚类的技术是对概念进行描述核对偏差进行分析的主要条件,它在一定程度上增加了人们认识世界的客观性。
1.3 数据挖掘技术的主要过程
(1)确定数据挖掘的主要挖掘对象;(2)准备相关的数据;(3)对转换后的数据进行挖掘;(4)对挖掘的结果进行分析和评估;(5)对知识进行同化。
将由之前步骤得出的知识进行综合并集成到相关的信息系统结构中。
2 基于数据挖掘的网络故障诊断分析
2.1 数据挖掘技术在故障诊断的过程中对数据进行选取以及预处理
(1)诊断工具对数据的提供。要想基于数据挖掘的基础上对网络的故障进行诊断和分析,首先必须应获得在一定程度上对网络的相关状态进行反映的信息,只有相关网络状态的信息越完整越全面,才能够将有关故障的信息更多的包含在内,才更有利于故障的发现和解决。
如果要全面获取相关网络信息,我们需要对计算机的网络管理以及网络故障的相关诊断工具进行参考,参考其是怎样提供相关数据的。
目前情况下,在计算机的网络管理方面,我们普遍采用简单进行网络管理的协议和管理信息的数据库,其中以管理信息的数据库为网络管理数据的主要标准。这项标准同样也规定了进行网络的代理时必须对数据的项目和类型,以及允许操作进行网络的代理。对相关的数据项目进行一定存取的访问,就可得到网络设备中的统计内容。之后可以再对多个相关网络设备统计内容进行综合性分析就可以实现网络的基本管理。因此,要想实现网络管理,其关键便是管理信息的数据库。最常用到的网络故障的诊断工具为协议的分析仪。
(2)对数据进行选择和进行预处理。由上文对故障诊断的辅助工具以及对网络进行管理的协议的数据选择进行参考,我们在对要进行挖掘的数据定位于数据包的相关统计信息,信息管理数据库的所有变量以及简单管理网络协议中的告警信息。
对于利用关联的规则进行挖掘的数据,我们采用的是将在同一个时刻下记录的统计信息,管理信息的数据库变量以及简单对网络进行管理的协议中的trap信息作为条目,也就是一条关于事物的数据。
分类的方法采用的是数据包的统计信息和简单对网络进行管理的协议中trap的信息为一条关于事物的数据。
聚类的数据采用数据包来进行信息统计,这样子便于对距离的计算。
2.2 关联规则运用于网络的故障诊断中
数据挖掘的技术中,关联的规则反映了某些事物之间存在一定的依赖关系或者某种关联的知识,其中如果有两项或者两项以上存在着一定关联,其中的任何一项属性便可根据其他属性进行一定的预测,并且用置信度、支持度以及最小的置信度和最小的支持度这四个相关的参数来确定下一条规定,从而可以根据这项规定将还不知道的障碍数据进行归类。
然而对网络故障进行诊断时,对一些关联规则的挖掘是有一定困难的。首先,网络故障方面的一些数据是不断随着时间增长的,旧数据与新数据集中混合进行挖掘,会出现工作重复的现象,我们需要在对旧的数据的结果进行充分利用的基础上将新的数据结果进行一定的吸收;其次,网络故障和特征事物彼此间的联系一般情况下联系时间较紧密。很明显,手工对网络故障进行诊断的分析仪器和对网络进行管理的软件提供的都是有时序性的信息,然而传统情况下关联的规则仅表示存在有先后的关系,并没有对时间上的具体情况进行描述。因此,我们需要挖掘网络故障的诊断知识时描述时间上的量变。
2.3 聚类的方法运用于网络的故障诊断中
(1)聚类方法的主要内容。顾名思义,聚类指的是通过查找事物之间的相似之处而对事物进行一定的分类。对于聚类的方法和技术的运用也是非常广泛的,无论是在医学方面,还是在模式的识别方面和图像的处理方面。从某种程度上讲,聚类的分析技术就是将一组数据进行分类,使得每一类中数据的相似程度达到最高。
(2)聚类分析的作用。我们在对网络中的故障进行诊断时,需要在故障发生的网络相关状态用几条收集的数据表达描述,然后提交,有诊断的系统做出相关诊断。然而聚类是将某个数据的集合按照其特点划分成几个特定类别。我们用聚类的方法无法对如此小量的数据得出相关的知识和结论,因而聚类无法完全发挥出它的作用。
因此我们在对聚类的相关技术进行使用来诊断故障时可以采用样本植入的方法。即先整理一个正确的类聚所有有关样本的故障样本的集合,然后将此时出现故障的数据样本全部植入到此集合中,在进行聚类的操作,获取结果。植入的相关样本在哪一个类别中我们就认为这些样本出现的故障为哪一类。
3 结束语
相比与传统的网络故障分析方法,数据挖掘技术有利于问题更高效更全面的解决。然而就我国目前来讲,数据挖掘的技术仍处于起步的阶段,我们仍然需要做出更多的改善和探究,才能使得数据挖掘技术在网络故障诊断中发挥更大的作用。
参考文献:
[1]申冰.基于数据挖掘技术的故障诊断系统研究[J].科邯郸职业技术学院报,2008(12).
[2]周焕银.基于故障诊断的数据挖掘算法研究[J].微计算机信息,2008(1).
作者单位:江西经济管理干部学院信息工程系,南昌 330088