论文部分内容阅读
基于人工免疫网络的数据聚类技术借鉴生物免疫系统的免疫识别、免疫记忆、免疫调节等机理,能够对大规模的数据自学习分类。将该技术对网络数据做聚类分析,定义正常和异常数据,为入侵检测提供了新的技术路线。基于人工免疫网络的数据聚类技术已成为网络安全新的热门研究课题。目前免疫聚类算法存在聚类复杂度高、对参数敏感、收敛速度慢、对大规模数据流处理低效等问题。相应的应用于入侵检测存在智能化程度低,检测率不高,误报率高等缺陷。本文在深入分析研究免疫机理和数据聚类技术的基础上,将免疫机理及数据挖掘技术中的关联规则结合提出新的聚类算法和检测方法。本文主要研究内容:1.研究人工免疫机理及数据聚类技术,分析目前几种常用的聚类技术,总结这些聚类技术的优缺点及适用范围。2.提出新的聚类算法(SA-aiNet算法)。为解决网络数据多种类型属性描述及量纲对聚类结果的影响问题,该算法中引入权重矢量及相关度的概念来度量数据间的亲和度。为更好地体现聚类抗体网络的动态性及简化性,引入模拟退火算法实现变异,通过概率准则来接受新解,实现数据最优化。通过实验仿真表明在小规模数据聚类上该算法比aiNet聚类算法具有更好的聚类效果。3.为解决SA-aiNet在大规模数据上的低效性,引入关联规则,提出新的聚类算法(AR-aiNet算法)。该算法第一阶段采取分而治之的思想对整个数据集聚类得到若干子簇,第二阶段应用关联规则将各个子簇合并得到最终的抗体网络集。采用大规模的KDD数据集作仿真测试,用DB准则对聚类结果评估,结果表明该算法的运行时间比SA-aiNet和aiNet算法显著减少。4.通过异常因子标记正常与异常,建立异常检测流程,将上文提出的算法应用于异常检测,实验仿真验证其有效性。