论文部分内容阅读
入侵检测技术作为“防火墙”、“数据加密”等传统安全保护措施后的又一个安全保障技术,对计算机和网络资源上的恶意使用行为进行识别和响应,不仅检测来自外部的入侵行为,同时也监督内部用户的未授权活动。近年来,入侵检测技术得到越来越广泛的应用。随着计算机技术和网络技术的不断发展,海量存储和高带宽传输的普及,入侵检测系统所面临的数据日益庞大;在入侵检测技术发展的同时,入侵技术也在更新,入侵方法越来越多样化与综合化。数据挖掘技术旨在从海量数据中提取隐藏的预测性的信息,发掘数据间潜在的联系,将数据挖掘技术应用到入侵检测中可以很好的解决这些问题。本文研究了数据挖掘中的聚类方法,并将其应用到入侵检测中。在研究各种聚类方法的基础上提出了一种基于距离的边缘抛弃聚类算法。该算法特点包括:聚类中心不是固定的,而是会随样本输入不断调整;每个样本所属的类别不是固定的,有可能会随着聚类中心的调整而从某一类转移到另一类中,即“边缘抛弃”。本文详细分析了本算法,并对初始化聚类中心、样本输入顺序、边缘抛弃的原则、算法结束条件做了具体和详细的研究。最后,本文在KDDCUP99数据集上,通过对数据的特征选择和连续化处理后,对本算法进行了仿真实验,实验结果表明,本算法具有较好的性能。