论文部分内容阅读
随着计算机的广泛应用和网络技术的快速发展,人们对信息安全及保密性的要求日益提高。数据加密、防火墙等都是被动防御措施,已不能完全阻挡攻击者的入侵。作为一种主动防御措施,入侵检测技术成为信息安全中重要的一部分研究内容。
入侵检测对误操作、外部攻击、内部攻击进行实时保护,在系统受到危害之前实施拦截并对入侵行为做出相应的处理,最大限度的减少攻击行为给系统带来的危害。但是随着网络技术的多元化、分布化及高速化,新的入侵手段层出不穷、日益多样化,网络流量飞速增大,传统的入侵检测技术面对这些问题存在着许多不足。新技术、新方法的研究是解决上述问题的关键。
入侵检测系统需要处理的数据量是非常大的,如何从大量的数据中抽取出有用的信息,从而进一步用来建立知识、行为规则库是一个难以处理的问题。数据挖掘技术可以很好的解决这一问题。目前国内外提出的数据挖掘技术在入侵检测中应用的算法比较多,但是并不存在一种能适合所有情形的数据挖掘算法,所以在算法研究方面至今尚无权威性的成果。聚类分析是数据挖掘技术中的一类重要算法,将相似的对象归为一类,更有利于人们找出有用的知识和信息。
CLIQUE算法是聚类算法中的一种,此算法在处理高维数据集时效果比较好,但是在聚类过程中,对子空间的非密集单元采取了裁剪的方法,算法采用的这种方法简单、易于实现,却导致了其聚类质量和效果不高。针对这一问题,本文采用细化技术对CLIQUE进行了优化处理。在处理非密集单元时,采用细化技术的思想,将其向密集单元移动,最后所有相关联的密集单元形成聚类。精细化处理的CLIQU算法克服了CLIQUE算法精度受方格大小影响、以及由于裁剪造成的聚类结果精确度不高的缺点。该算法结合了网格聚类的低时空复杂度和密度聚类的良好抗噪性的特点。
本文探讨了入侵检测技术、数据挖掘技术和聚类分析技术,对异常检测、误用检测、基于主机的和基于网络的检测技术做了详细描述;详细介绍了常用的数据挖掘算法及数据挖掘技术在入侵检测中的应用;对常用的聚类算法进行了详细的描述并进行了对比分析,重点研究了基于网格和密度的CLIQUE算法。
本文将网格和密度相结合的聚类算法应用在入侵检测中,目的是解决现有入侵检测算法中普遍存在的对数据输入顺序敏感的问题。用KDDCUP1999的数据集进行了仿真实验,将细化处理的CLIQUE算法和原CLIQUE算法进行了对比分析,实验结果表明新算法比原算法有较好的检测效果,提高了检测率,降低了误报率,并且对未知入侵也有一定的检测能力。