论文部分内容阅读
网络管理的目标是最大限度地增加网络的可用时间,提高网络设备的利用率、网络性能、服务质量和安全性,提供网络的长期规划。随着网络规模的不断扩大、用户的快速增长,以及日益复杂的攻击和病毒的影响,网络的管理和维护变得越来越重要,越来越困难。传统网管软件使网络管理者能动态的观察网络中的设备状态及网络位置,但是无法得到各个设备间的故障关联,无法得到各个协议间的性能影响,同样无法发现隐藏的“软性”故障。这些“软”故障往往由网络攻击造成,并且慢性蔓延,往往在造成了实质性的网络瘫痪之前,已经潜伏了很长时间。如何能够在“软性”故障产生初期就能够发现,从而预测到之后实质性网络故障的发生,这对管理网络有重要的现实意义。网管系统、入侵检测系统、防火墙等网络管理软件每天产生大量网络性能数据和告警。这些数据中有大量潜在的关于网络运行过程中,各个设备的性能数据,这些数据是网络性能的真实反映,隐含着网络各元素间关系的真实情况。基于这些数据而获得的知识对网络的性能分析和维护有重要意义。因此我们必须找出新的方法研究网络性能,而数据挖掘的方法对网络性能知识发现有非常重要的意义。如何将“事后”处理策略变为“事先”,如何能够预测到问题的出现,则是本课题研究的目的。针对课题,论文主要侧重于通过对网络数据的收集和分析,选定适用的数据挖掘算法,并将分类算法具体应用为决策树算法,重点是解决挖掘方法的选择与多数据源的数据仓库的生成。通过对网络数据的分析,发现要达到预测网络故障的目的,仅仅采集传统网管数据是不够的,需要结合IDS和防火墙的其他针对网络攻击的告警数据。结合后的数据源,满足了系统的需求。在此基础上,研究了网络管理系统的体系结构和诊断方法,确定了模式分类所用到的各种运行数据信息。并且引入了一个改进的决策树算法C5,用这个算法作为数据挖掘的方法对故障信息进行分类。文中第1章提出了现金网络管理中存在的问题以及基于数据挖掘技术的网络管理系统;第2章通过分析数据挖掘与网络管理技术的理论,提出不同发现模式对网络故障诊断预测的适应性问题,并给出答案,此为文中一个重点;通过前面的分析,第3章将发现方法定为分类方法的决策树算法,并且根据网络数据的特点,给出了关于网络风暴实例的决策树生成过程;文中的另一个重点是数据源的选择与数据仓库生成的问题,这在第4与第5.3节做了详细阐述;第5章主要是对系统实现框架的提出,和各个主要问题的说明;第6章搭建了实验环境并获得了预期的实验结果。