基于机器学习的网络入侵检测技术研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:luochaojie123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过几十年的发展,互联网已经渗透到了社会的各个领域。伴随而来的是各种各样的网络入侵,几乎每天都在上演。而网络入侵检测作为计算机安全的一个分支,旨在自动有效地检测出网络中的入侵流量,并及时预警。基于机器学习的网络入侵检测是将网络入侵检测的问题建模成一个针对网络流量的分类问题,从而使用一些机器学习的方法训练出分类模型,进行分类预测,进而识别出入侵流量。机器学习的训练首先需要学习流量的特征,但是网络流量就有很多个维度的特征,使用过多的特征不仅会影响学习的效率,还可能会造成维度灾难,严重影响训练出分类器的效果。所以本文提出一种叫CFS-BSFLA(Correlation-based Feature Selection-Binary Shuffled Frog Leaping Algorithm)的特征选择方法,该方法使用基于特征关联性的指标对特征子集进行评估,并使用改进的混合蛙跳算法进行搜索,从而筛选出较好的特征子集。通过在CIC-IDS 2017数据集上进行仿真验证,将筛选出的特征子集在朴素贝叶斯、决策树、K最近邻、随机森林等常见的机器学习分类算法上进行学习和分类预测,并与其他常用的特征选择算法如信息增益,信息增益率等筛选出的特征子集进行对比,结果表明,该方法在决策树、随机森林、K最近邻算法中具有比较好的效果。由于网络流量中大部分是正常流量,只有一小部分是入侵流量,所以网络入侵检测中存在比较严重的数据不平衡问题。针对这一问题,本文提出一种双边界下采样方法,结合聚类边界分析和类别边界分析的思路,对数据集中的正常流量样本进行下采样,筛选出其中处于类别边界的流量和部分位于本类别内聚类边界的流量,从而使数据集中属于正常流量的样本数大大减少,并且使其中的具有代表性的样本得以保留。最后在CIC-IDS 2017数据集上进行仿真验证,并与随机下采样方法进行对比,验证了该采样算法的有效性。
其他文献
通过热压缩试验研究TC4(Ti-6Al-4V)合金在应变速率为0.001~100s-1,变形温度为750~1050℃条件下的热成形性能。建立了基于流动应力的TC4合金本构方程。综合考虑应变速率和变形
所有权和经营权分离是现代企业的重要特点,在两权分离下,拥有所有权的股东往往不直接控制公司的经营状况,而是聘用专业的管理人员经营管理公司。股东将公司的经营权交予管理者能否达到预期目标取决于管理者能否按照有利于公司发展的方式进行经营。根据“经济人”假说,股东与管理者均为自身效用最大化的追求者,所以管理者不会总是根据股东的最大利益经营公司,同时,作为经营者的管理者又拥有着比股东更多的信息优势,这就导致管
<正>斑鰶(Konosirus punctatus)隶属硬骨鱼纲(Osteichthyes),鲱形目(Clupeiformes),鲱科(Clupeidae),斑鰶属,俗称窝斑鰶、扁鰶、海鲫、斑点水滑。在我国黄渤海、东海、南海均
魏晋诗歌创作逐渐走向繁盛,并成为独立文学门类,因此在文论中出现对诗歌创作需凸显其特性的自觉。从"诗赋欲丽"到"缘情""绮靡",显示了对诗歌审美特性认识逐渐走向深刻,并渐渐
习近平总书记曾多次强调,基层工作很重要,基层不牢,地动山摇。街道是政府的神经末梢,“兵头将尾”位置重要,尤其对维护国家经济平稳发展和社会和谐稳定的作用不可低估。因此,以什么态度和精神从事基层服务管理工作,事关党和国家工作大局。  北京市西长安街街道面对当前经济社会发展新阶段和首都发展新时期,面对街道和社区日益成为各种利益的交汇点和社会矛盾的集聚点这样的现实,能够准確研判和把握所辖街区的区域特点,主