论文部分内容阅读
入侵检测系统是继数据加密、访问控制和防火墙等传统安全保护措施之后的新一代安全保障技术,作为一种积极主动的动态防护技术已成为近年来的研究热点。入侵检测系统在计算机网络或系统中采集信息,对收集到的信息进行分析,从中发现网络或系统中是否有被攻击的迹象或违反安全策略的行为,从而对这些攻击或行为采取措施,保护计算机的安全。经过近30年的发展,传统入侵检测系统对已知数据的检测率较高,误报率低,但对于未知攻击效果不佳。近年来数据量剧增,其中存在大量的可用数据,而且也需要将其变化为有用的知识,使得数据挖掘得到广泛应用。聚类分析是数据挖掘技术中的一项基本技术,它的目的是将数据聚集分成不同的类,使不同类中的对象差别尽可能的大,而相同类中的对象则尽可能的一致。因此,人们通过聚类能够把密集的和稀疏的区域分开进行处理,从而发现新知识。在聚类分析中,模糊C均值算法是应用比较广泛,但是它有一个致命的缺点:对初始值非常敏感,容易陷入局部极小值。而遗传算法是一种通过模拟自然进化过程,可以获得搜索最优解的方法,因此给出了基于FCM算法和遗传算法的新聚类方法简称为FGA算法,它兼顾了遗传算法的全局寻优能力和FCM算法的局部搜索能力,有效地实现聚类问题,这样在应用到入侵检测时有利于对检测率的提高,同时有效改善了误报率。由于FGA算法运行较慢,本文对此进一步改进。它在原算法为基础,对算法的各项操作出改进,首要的是允许个体可以含有空类;另外应用了增量式技术,增量式计算类中心的值和目标函数的值,有效改善算法效率。本文利用KDD CUP 99数据集对所给出的算法进行仿真实验,经过实验验证FGA算法的聚类效果要优于FCM算法;改进的FGA算法由于简化了操作和增量式计算要比原FGA算法的收敛速度快,特别是当输入的变异概率比较小的时候,这种优势更明显。实验结果表明,FGA算法在入侵检测领域有着广阔的应用前景。