基于流量数据的网络异常检测算法研究

来源 :云南师范大学 | 被引量 : 0次 | 上传用户:skylong5257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网诞生之日起,互联网技术就再不断发展进化,这注定了人类会进入信息化时代,现如今大数据时代的来临,不仅给人类生产带来快捷和便利,人们的生活也从中获益颇多。互联网的发展演变在方便人类的同时,网络安全的问题也如影随形,新的攻击层出不穷,给人民的生活生产带来了极大的损失。特别在大数据时代,政府和军事机构都把网络安全提升到了国家战略中。人们对网络安全的研究由来已久,但也经久不衰,网络安全处理的问题随着技术和时代的推进也再不断更新。综合前人对网络安全的研究,目前学者们取得了不错的成果,但同时普遍存在效率低、检测率较低等问题,现如今需要处理的数据是高速庞大的,所以仍然需要继续对网络异常检测进一步研究。为了解决在异常检测中存在的这些问题,从提高构建正常行为模型的效率,提升检测率及降低误报率作为出发点来研究异常检测。首先,综述了网络技术发展和异常检测的相关知识,分析了异常检测中存在的问题,把网络异常的定义作为本次研究的总原则。然后,通过对网络流数据进行分析,根据网络异常数据所表现的规律,提取出了4个数据特征属性指标,并通过信息熵的方式对数据进行特征表示,从而减少数据量,接着利用改进后的二分K-means算法对特征属性指标建立正常的行为特征训练集。最后,根据构建的正常行为特征训练集作为基准对待检测数据进行检测,通过研究分析TCM-KNN算法的思想,对其进行改进,提出了一种与改进二分K-means算法建立正常行为特征训练集能对接的ATCM-KNN算法思想,利用该算法思想完成待测数据的异常检测。对算法的验证,本文选用了林肯实验室的数据集,通过理论和仿真实验说明所选用的数据特征属性是有效的,通过信息熵的方法表现数据特征从而减少了相应的数据量;在验证构建正常行为特征训练集的效率时,所选用改进的二分K-means算法相较于传统的聚类算法在效率上是有所提高的;在对数据进行检测的实验验证方面,提出的ATCM-KNN算法在进行异常检测时,检测率和误报率的平衡关系上与传统的检测算法相比较,该算法有很大的改善。
其他文献
根据新版《食品安全法》规定,保健食品是特殊食品之一,不能替代药品,却是亚健康人群非常青睐的一类产品.保健食品市场需求量大,产品琳琅满目.基于此,本文首先对广东省保健食
北运河是北京市东南部重要的排水河道,流域内人口密集,高新产业集中。文章着重探讨在北京城市副中心建设和京津冀协同发展等新形势下,北运河防洪工作面临的新挑战、新课题,并
以山西省典型盆地孔隙水超采区为研究对象,选取降水、不同行业地下水取水和煤矿开采排水等因素作为影响因子,采用统计学的相关分析法计算2000年以来典型盆地超采区水位变幅与
北京首都公路发展集团有限公司京开分公司杜家坎收费站是通行G4京港澳高速进出京的关口,受地理位置影响,杜家坎收费站每日车流量巨大,单车道单班次入口车流量达到2000辆次,出
当前,混凝土材料已经被广泛地应用到土木工程施工中。混凝土的质量极大地影响着土木工程建筑的质量,要提高土木工程的质量,就要牢牢把控好混凝土的质量。基于此,分析混凝土结
[摘 要]《数学课程标准》把义务教育阶段数学课程的总目标分为知识技能、数学思考、问题解决、情感态度四个方面,可见培养学生的数学思考是数学课程四大目标之一。数学课堂中,教师应引导学生积极进行思考,养成良好的思维习惯,形成较强的思维能力,使学生在数学学习中得到更好的发展。  [关键词]数学思考;问题化;生态化;成果化  [中图分类号] G623.5 [文献标识码] A [文章编号] 1007-9068
在我国火成岩风化残积,强地震,尾矿排土及工程建设挖方倾倒形成大量松散非饱和土边坡,每年雨季期间失稳滑坡时有发生,量大面广。该类降雨诱发滑坡大多为浅层滑动,滑动面深度1