论文部分内容阅读
入侵检测系统(Intrusion Detection System,IDS)能够用来实时识别计算机网络和计算机系统中的入侵行为。入侵检测过程是:首先利用数据采集模块采集原始数据,如网络流量、程序的异常行为、系统或网络的日志文件、系统目录和文件的异常变化等;预处理模块对原始数据进行分析处理,转换为样本数据并保存为数据库;然后处理模块对样本进行判断,用统计分析、模式匹配等方法判断样本是否存在异常行为;最后响应模块对异常信息做出处理,例如报警、切断网络连接等。
本文的主要工作是研究了入侵检测样本数据的特征,设计了基于模糊化关联规则挖掘的入侵检测方法。本文主要贡献如下:
(1)研究了数据挖掘在入侵检测中的应用,针对入侵检测的特点和数据挖掘的优点和缺点,设计了模糊关联规则挖掘的入侵检测方法。该检测方法的核心是模糊关联规则分类引擎,即通过估算待检测样本与各类模糊关联规则集的匹配度来对样本分类。
(2)研究了Apriori结合模糊化的关联规则挖掘算法(Fuzzy Apriori),研究了Fuzzy Apriori用于入侵检测的方法,并设计了实验,验证其相对于二值化的Apriori算法在检测率上有所提高。
(3)本文设计了基于模糊化的频繁模式增长(Fuzzy Frequent PatternGrowth,Fuzzy FP-Growth)算法。针对Fuzzy Apriori算法效率不高的问题,本文设计了模糊FP-Growth算法,设计了模糊化的FP-tree构建和挖掘过程,并设计新方法对模糊FP-tree进行剪枝,剔除不包括在规则中的项,加速挖掘过程。该方法还能在挖掘频繁项的同时推导关联规则,取代了最后扫描数据库推导关联规则的步骤,加速了整个训练过程。该技术将模糊化理论和频繁模式关联规则挖掘结合起来,实验结果表明,该技术有效地提高了学习效率,并降低了漏报率。