论文部分内容阅读
近年来,伴随着计算机网络的飞速发展,网络入侵事件也日益猖獗,而传统的网络安全技术如反病毒技术和防火墙技术要防范入侵比较困难,这就使得入侵检测成为网络安全研究体系中的一个重要的组成部分。在入侵检测技术中,基于规则的误用检测技术发展比较成熟,但由于该项技术的一些本质局限性,使其成为入侵检测技术中的一种低级形式,发展空间也相对有限。而异常检测技术作为入侵检测技术的一种比较高级的形式,已经成为入侵检测研究领域的热点。异常检测技术最大的优势在于它能根据已知的入侵模式检测出未知的入侵。数据挖掘、神经网络、支持向量机等许多技术都可以用于建立异常检测模型。本文将物理世界中的万有引力概念和万有引力定律引入到数据分类问题中,提出了一种新的数据分类方法DGC(Data Gravitation based Classification),并基于该理论建立了一种高效的异常检测模型。DGC将数据空间中各数据点之间的相似性定义为数据引力,认为数据空间中任何两个数据点之间都存在数据引力,克服了传统数据挖掘技术中用局部联系的观点对待数据的缺陷。在数据引力的基础上,本文提出了数据空间中数据引力定律,给出了数据引力的计算方法,并通过对数据引力大小的比较,对数据进行分类。在DGC理论的基础上,本文针对异常检测中特征选择的问题,进一步提出了特征加权的思想,并用一种尝试性随机选择算法对特征的权值优化。在DGC算法模型中通过对加权特征进行选择,建立了DGC的改进算法模型WDGC(Feature-Weighted DGC)。通过对数据挖掘中的高维度数据的自动子空间聚类算法(CLIQUE)研究,本文借鉴CLIQUE聚类算法关于高维度数据空间单元划分的思想,将该思想引入到异常入侵检测中,提出了一种基于高维度数据单元划分算法HDUP(High-Dimension Data Unit Partition),并基于该算法理论建立了一种对高维度入侵检测数据有效的异常检测模型。实验结果表明,基于DGC/WDGC和基于HDUP的异常检测模型与传统的异常