基于组合学习的网络流量异常检测方法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:w346399938
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测一直是网络安全方向的热点课题,网络异常流量检测是组成入侵检测系统的重要工具。为了解决异常流量高维性、离群点容易造成分类模型过拟合和忽视异常流量内语言文本含有的丰富语义结构等问题,本文的主要研究如下:首先,针对网络流量维数过高的问题,提出一种基于信息增益率的前向特征选择算法。采用贪心策略将难以选取候选特征子集的问题的解决策略指定为计算流量记录里各特征的信息增益。还为提高数据的质量做出了贡献。其次,针对离群点严重影响了分类算法的分类准确率的问题,提出一种基于空间聚类和近邻密度组合的离群点检测。通过Kmeans聚类和V近邻分布密度综合分析离群点与正常样本点间的不同,剔除离群点,减少离群点对支持向量机过拟合的影响。然后针对分类器参数的选取问题,提出了GA-SVM的分类算法。通过编码、初始化种群、计算种群中个体适应度、选择、交叉和变异等方法取到参数值的最优组合,进一步提高检测异常流量分类的准确率。再次,对非数值特征全部数值化的数据预处理方法忽视了文本数据里隐含的规律的问题,提出一种基于文本数据特征提取的PSO-DT分类算法。特征选择阶段使用元音字母比、唯一字母个数和Jarcard系数将文本数据扁平化后,再进行过滤和分块,得到区分度最大的若干特征;训练阶段选择利用粒子群算法对决策树参数优化,最后得到最优的参数值。最后,通过使用Python语言中的Scikit-learn等机器学习工具库,采用NSL-KDD数据集和360 netlab开放数据集对提出的算法进行实验。实验结果表明,组合学习的网络异常流量检测算法可以有效地完成网络异常流量的分类。基于文本特征的决策树参数优化算法可以高效地对DNS流量进行分类。
其他文献
随着人工智能和机器人技术的不断提高,面向日常生活的家庭服务机器人也越来越普及,使用自然语言指令提高人机交互体验势在必行。但机器人很难识别并解析人类的自然语言,所以将自然语言指令解析成机器人能够处理的形式完成目标的映射是人机交互最为重要的一环,本课题将围绕此任务展开,并细化为以下几个方面。首先,自然语言指令解析需要进行意图检测和槽填充,为了利用这两者之间的关联性,提出了一个基于Graph LSTM和
蛋白质的空间结构决定着蛋白质的功能,对于推断蛋白质结构之间的进化关系,药物发现和蛋白质设计至关重要。机器学习的进步促进了蛋白质结构预测的发展,使其预测速度由月、天、时提升到了秒、毫秒级单位,而其中代码数量也由百万行减少到几千行。然而,蛋白质结构的预测精度以及稳定性是否符合人们的需求还需要进一步的分析。本文以循环几何网络RGN预测的蛋白质三级结构数据为主要研究对象,从结构比较,可视分析角度以及RGN
随着深度神经网络发展以及大规模数据集的出现,普通图像识别已取得很大成功;然而细粒度图像由于类内差异大、类间相似度高,易受恶劣环境影响,导致其精确识别困难。针对上述问题,提出一种基于双线性的循环注意卷积神经网络(Bilinear Recurrent Attention Convolutional Neural Network,BRAN)细粒度图像识别方法,并应用于海洋细粒度鱼类图像的分类研究中。首先
供暖管道在长期使用中就一直出现热力不均衡问题,在此问题上给居民和供暖工作带来了很多不必要的麻烦。所以,现在主要任务就是先将供暖管道热力不平衡问题处理,给城市居民带来舒适的居住环境。本文主要对供暖管道热力不平衡问题进行研究与分析,并提出主要应对对策。
我们利用两个全同二能级原子与双模真空腔场相互作用并得到了四体近似W态。我们发现不论两原子初始处于Einstein-Podolsky—Rosen纠缠态或者非纠缠态,四体近似W态都能实现。并且四体纠缠随着系统的初始态和失谐量的变化而变化。重要的是,当两原子初始处于Einstein-Podolsky-Rosen纠缠态时,原子-原子,腔场-腔场的纠缠可以达到最大值1.而两原子初始处于非纠缠态时,原子-原子
蛋白质三维结构预测一直是分子生物学的重要课题,传统实验方法非常复杂且耗时较长。随着深度学习的兴起,RGN(Recurrent Geometric Networks)作为一种深度学习模型已成功应用于蛋白质三维结构预测。该模型通过一条氨基酸序列及相关PSSM(Position Specific Scoring Matrix)信息来预测一条序列对应的蛋白质主链三维结构,其预测结果的精度可以媲美目前最优方
不同患者对同一抗癌药物的反应可能不同,了解患者之间对抗癌药物的反应差异对癌症精准医疗具有重大参考价值。高通量测序数据的不断完善为构建抗癌药物反应分类预测模型,进而挖掘数据背后隐藏的信息提供了良好的数据基础。基于两大经典数据集,癌症细胞百科全书(CCLE)和癌症药物敏感性基因组学(GDSC),本文构建了两种预测癌细胞系对抗癌药物敏感或抑制的二分类模型,为抗癌药物反应预测和生物标志物识别提供了可选择工
随着新能源分布式发电的发展与国家对智能电网的布局,电能路由器成为近年来的研究热点,隔离型双向变换器作为电能路由器实现电能灵活控制的主要部分,不仅充当着不同电压等级之间能量流动的桥梁,还实现了电气隔离。本文针对区域电能路由器中蓄电池储能问题,提出一种三电平电流型推挽双向DC/DC变换器,主要研究内容如下:根据传输电感电压的不同状态,将三电平电流型推挽双向DC/DC变换器的工作区间划分为四种正向模式(
呼吸信号的监测在临床和家庭日常监护中起着非常重要的作用,传统的呼吸气流法和胸部阻抗法监测具有局限性,不适合长时间连续监测。部分研究者通过心电信号或光电容积脉搏信号拟合呼吸信号,准确性差,且考虑的特征属性单一。为此,本文针对静息状态下和活动状态下的呼吸信号预测方法进行了研究,主要工作如下。首先,对呼吸相关生理信号和生理参数进行了分析,并提出基于心电信号和光电容积脉搏信号的呼吸信号特征提取方法。为后文
随着科技的进步,越来越多的复杂系统涌现出来,产生的相关数据呈直线增长,这些数据对复杂网路的研究也起到了推动作用。链路预测是复杂网络的一个重要研究方向,主要解决的是如何通过已知的数据及其之间的相互作用关系,预测那些已经存在但尚未被观测到的数据、未来可能出现的数据和一些虚假的数据。随着链路预测的研究成果广泛应用于各个领域,如何提高链路预测精度成为了首要问题。本文的研究主要是基于网络拓扑结构的,以网络中