论文部分内容阅读
现代社会,随着计算机技术与通信技术的发展,计算机的应用越来越广泛,但同时网络安全问题也日益突出。传统的安全保护措施如防火墙、数据加密等已不能完全满足网络安全的需要。入侵检测是一种新的安全技术,相对于传统的安全措施,它是一种基于主动防御的技术,在网络系统受到危害之前能够检测入侵和异常,并作出相应的响应措施。入侵检测的关键在于有效地收集数据,并对各种行为进行分析。然而,网络环境中各种攻击与破坏与日俱增和网络数据的海量化为入侵检测带来了很大的困难。数据挖掘的引入为入侵检测提供了很好的手段。以往的基于数据挖掘的入侵检测方法要求训练集中的数据已经过标记并且数据样本是“干净”的。聚类是一种无监督的学习方法,可以在未标记数据集上建立检测模型或发现异常数据,克服了传统数据挖掘方法的缺陷。基于上述研究背景,本文开展了基于聚类技术的入侵检测的研究,首先对入侵检测技术和聚类进行了介绍与分析,探讨了聚类算法在入侵检测中的应用。针对传统模糊C-均值聚类算法在入侵检测应用中存在的问题,如对初始值敏感、易陷入局部最优等,本文引入带交叉操作的微粒群算法对其优化,提出一种改进的模糊C-均值算法。采用KDD CUP1999数据集中的数据对改进后的算法进行实验,结果表明,算法具有较好的入侵检测效果。特征选择被广泛用来降维和去除不相关特征,它一般用来作为分类工作的预处理步骤,通过消除不相关和冗余的特征,可以避免维灾难,提高运算速度和降低计算代价。入侵检测中的数据具有高维性和数据特征复杂等特点,这样特征选择在入侵检测中的应用非常有必要。本文提出了一种基于聚类和微粒群的特征选择方法,采用KDD CUP1999数据集进行实验,实验结果表明,本文算法加快了特征选择的速度,所选择的特征子集具有较好的分类效果。