论文部分内容阅读
随着计算机网络技术的迅速发展及应用普及,在抵制防御计算网络入侵的技术中,入侵检测技术对其安全的保障发挥着重要的作用,它是一种能够协同防火墙的实时监控和动态保护网络安全的动态策略。入侵检测模型的优劣取决于入侵分析模块的好坏,入侵分析模块的好坏由入侵检测实时数据的检测率和效率表现,所以入侵检测模型最终由检测率和效率评断。为了提高异常检测系统的检测率和效率,入侵检测研究者在众多方法中做了相关工作并取得了成绩。迄今为止,在入侵检测领域中却没有统一的方法与理论,寻求一类相对优越的方法和理论成为了本文的研究目的。入侵检测数据集是典型的大数据集,而处理大数据的分类预测问题,数据挖掘是最有效的处理方法。利用数据挖掘分析数据的常用方法有人工神经网络、决策树、统计分析等。本文主要研究了基于Clementine软件的数据挖掘方法在入侵检测系统中的应用,相关工作如下:1.分析C&R、C5.0、CHAID三种决策树理论方法与原理;研究BP(ErrorBack Propagation)和RBF(Radical Basis Function)两种人工神经网络理论原理与各自优劣性;分析统计分析中的Logistic回归分析方法理论。2.熟练操作数据挖掘clementine软件,并能通过clementine软件建立各种分类预测模型,通过设置和调整参数使其模型最优化。3.导入预处理的KDDCUP’99入侵检测数据集到各类数据挖掘方法中,建立相应的仿真实验模型,分析实验结果并给出最优的数据挖掘方法。模型结果:通过对各种分类预测模型检测率的比较分析,在多分类检测时,人工神经网络模型优于Logistic回归分析模型;在两分类检测时,决策树中的C5.0模型优于人工神经网络模型。所以当检测数据是否入侵时使用C5.0决策树模型,而需要细分入侵数据的具体入侵类型时,使用人工神经网络模型。