论文部分内容阅读
目前,随着网络攻击越来越猛烈,网络安全技术得到了人们广泛关注。入侵检测是一种提供主动防御攻击的技术,得到越来越多的关注。特别是近几年人工免疫系统的研究,应用到计算机领域,给入侵检测系统的研究带来了新的启发。但是传统的人工免疫系统大多建立在“自我和非我”的基础上,存在着自体集过大、难以区分自我和非我的缺陷,随着危险理论的提出很好的弥补了这个缺陷。而建立在危险理论基础上的树突细胞算法(Dendritic Cell Algorithm DCA)由于不需要大量训练样本、简单方便、容易实现等优点,在入侵检测技术的研究领域得到了专家的青睐。它独特的生物特性,如自适应性、鲁棒性、耐受性等,正是入侵检测系统所需要的,所以把树突细胞算法应用到入侵检测系统中可以更好的保护计算机安全。由于来自网络的数据具有高维、复杂、大量冗余、属性缺失、不完整等特征。而一般成熟的算法对输入数据都有一定的要求,比如输入数据干净、完整、维度低等,所以需要对数据进行预处理,然而目前基于树突细胞算法的入侵检测系统对数据的预处理大都采用较为简单的处理技术,不仅费时费力,而且往往难以实现。因此实现树突细胞算法的数据自动预处理就显得特别重要,针对这个情况,本文主要做了如下工作:1.采用主成分分析法与树突细胞算法相结合的思想,来实现输入数据的自动预处理。其中涉及到用维数约简的方法对高维数据进行降维处理;用主成分分析法提取特征值,实现信号的自动选择和分类。2.研究了主成分分析法的数学推导和算法,并对树突细胞算法的生物学机理、工作原理及其算法做了深入研究,并设定了输入输出信号的权值转换、参数设置等问题。3.利用KDD CUP99的部分属性子集作为实验用数据集,通过与信息增益法和相关系数法提取的特征属性计算出的入侵检测系统的检测率和误报率的比较得出结论,即将主成分分析法应用到树突细胞算法中实现数据的自动预处理使入侵检测系统有高的检测率和低的误报率。