论文部分内容阅读
随着计算机网络技术的不断发展,网络安全问题日益突出。单一传统的静态网络安全技术如防火墙、数字加密策略等往往无法满足用户需求。网络异常检测,作为一种重要的动态网络安全防御技术,越来越受到研究者与网络用户的关注,目前已成为网络入侵检测领域重要研究方向之一。当前已有的网络异常检测方法普遍存在着误测率较高、检测精度不够等问题,为解决这些问题,本文以粒计算邻域模型为基础,重点研究基于邻域关系的离群数据挖掘方法及其在网络异常检测中的拓展。主要开展了以下研究工作:1.提出了基于邻域关系的离群检测算法NROD(NeighborhoodRelation-Based Outlier Detection)。该算法定义了邻域划分,形成邻域粒子,并通过相对邻域熵(Relative Neighborhood Entropy)的概念来确定各个对象的异常程度,利用了其度量数据对象之间不确定性的优势,准确、有效地挖掘异常数据对象。2.将NROD算法研究相关的相对邻域熵概念引入直推信度机TCM(Transductive confidence machines)算法框架中,利用相对邻域信息熵作为度量数据对象异常程度的新工具,重新定义了算法中的离群度(Strangeness),提出了一种基于相对邻域熵的网络异常检测算法TCM-RNE (Transductiveconfidence machines for Relative Neighborhood Entropy)。3.针对所提出的NROD算法和TCM-RNE算法,分别在UCI数据集和KDD Cup1999数据集上进行了实验验证和分析。实验表明,NROD算法相比传统离群检测算法,在处理混合数据类型以及连续性数据类型的离群数据挖掘任务时,误测率更低,检测准确率更优,算法有效可行。另一方面,相比李洋等提出的改进TCM-KNN(K-nearest neighbors)算法,当异常数据占比1%~2%时,TCM-RNE算法在特定的攻击类型情况下(如U2R攻击类型)的准确率略优,但对所有实验情形,误测率显著降低,平均下降7%。同时抗噪性能的检测实验显示TCM-RNE算法具有很好的抗噪能力。