论文部分内容阅读
互联网诞生之日起,互联网技术就再不断发展进化,这注定了人类会进入信息化时代,现如今大数据时代的来临,不仅给人类生产带来快捷和便利,人们的生活也从中获益颇多。互联网的发展演变在方便人类的同时,网络安全的问题也如影随形,新的攻击层出不穷,给人民的生活生产带来了极大的损失。特别在大数据时代,政府和军事机构都把网络安全提升到了国家战略中。人们对网络安全的研究由来已久,但也经久不衰,网络安全处理的问题随着技术和时代的推进也再不断更新。综合前人对网络安全的研究,目前学者们取得了不错的成果,但同时普遍存在效率低、检测率较低等问题,现如今需要处理的数据是高速庞大的,所以仍然需要继续对网络异常检测进一步研究。为了解决在异常检测中存在的这些问题,从提高构建正常行为模型的效率,提升检测率及降低误报率作为出发点来研究异常检测。首先,综述了网络技术发展和异常检测的相关知识,分析了异常检测中存在的问题,把网络异常的定义作为本次研究的总原则。然后,通过对网络流数据进行分析,根据网络异常数据所表现的规律,提取出了4个数据特征属性指标,并通过信息熵的方式对数据进行特征表示,从而减少数据量,接着利用改进后的二分K-means算法对特征属性指标建立正常的行为特征训练集。最后,根据构建的正常行为特征训练集作为基准对待检测数据进行检测,通过研究分析TCM-KNN算法的思想,对其进行改进,提出了一种与改进二分K-means算法建立正常行为特征训练集能对接的ATCM-KNN算法思想,利用该算法思想完成待测数据的异常检测。对算法的验证,本文选用了林肯实验室的数据集,通过理论和仿真实验说明所选用的数据特征属性是有效的,通过信息熵的方法表现数据特征从而减少了相应的数据量;在验证构建正常行为特征训练集的效率时,所选用改进的二分K-means算法相较于传统的聚类算法在效率上是有所提高的;在对数据进行检测的实验验证方面,提出的ATCM-KNN算法在进行异常检测时,检测率和误报率的平衡关系上与传统的检测算法相比较,该算法有很大的改善。