论文部分内容阅读
随着计算机网络应用的普及和网上商务活动的日益频繁,计算机系统和网络的安全问题越来越突出。攻击事件发生的数量逐年增加,近几年的上升幅度更为明显。同时这些安全事故给社会造成了巨大的经济损失。通常使用入侵避免技术和防火墙技术,例如用户身份认证、避免程序错误等技术来作为防御攻击的第一道防线,但是光有入侵避免技术还不足以完全防止入侵,例如无法防止局域网内部的攻击。因此有必要使用入侵检测技术来作为防御攻击的第二道防线,这样也使入侵检测技术的研究逐渐受到人们的重视。然而,传统的入侵检测系统在有效性、适应性和可扩展性方面都存在不足,尤其是在遇到新的入侵类型时变得无能为力。本文首先介绍了现在流行的一些基于数据挖掘的入侵检测模型,并对每种模型进行了分析,在这个的基础上,提出了用数据挖掘当中的分类算法去构建检测模型,以其通过这些模型能构造出相应的系统,本文也将从数据处理的角度,用数据挖掘的方法根据审计数据建立描述入侵行为的模型,并以此作为描述入侵行为的工具。在模型的建立当中,我们选用了KDD CUP1999的比赛数据来建立误用检测模型,通过Weka数据挖掘软件和Sql server 2000数据库系统对这些数据进行分析,期望能获得一个最佳的分类学习算法。我们先使用C4.5算法对训练数据进行训练,对训练过的攻击记录检测结果相当理想。对于没有经过训练的不理想的检测结果,我们又提出了扩展的C4.5算法,在本文中我们使用保持的方法扩展C4.5,并使用这种方法进行了大量的实验,实验证明这种方法具有检测效果好、运行代价低和训练代价低的优点。本文通过误用检测得出的分类决策树规则,使用Eclipse构造出完整的通用的实时的异常检测模型,最后提出了今后学习和努力的方向。