基于XGBoost算法的入侵检测分析与应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sunshineaigeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络技术的发展使得互联网的体量呈爆发式得增长。随着网络服务越来越多,网络安全问题也越来越得到人们的关注。从上世纪80年代开始,为了应对网络威胁,网络安全技术就已经开始投入了研究。许多经典的网络安全机制如数字签名、网络加密层、访问控制列表技术以及防火墙技术等等,在过去网络变化较少的情况下能够达到不错的网络安全保障效果。但是在现在的网络环境中,频繁的网络状态变化已经使得以上这些静态防护措施的效果变得越来越差,因此引入了入侵检测系统。入侵检测系统与传统的网络安全技术不同,从性能表现上来看,入侵检测系统能降低整体的误报率。对未知的攻击来说,入侵检测系统能够快速做出反应,主动学习新的威胁特征,保证了漏报率的降低。入侵检测系统中最重要的部分是检测分析所采用的方法。近年来,机器学习技术得到了长足的发展,因此本文从决策树算法开始引入,对该类机器学习算法的原理展开叙述。同时阐述了机器学习算法中决策树算法应用于入侵检测系统的优势并简单评估了算法的性能表现。之后在决策树算法的基础上,引入了最新的XGBoost算法。与基础的决策树算法相比,XGBoost算法在正则化优化方面引入了L1正则化与L2正则化,并在代价函数中加入了正则项,以控制整个模型的复杂度,防止过拟合现象的产生。从代价函数的角度来看,梯度提升树算法只使用了一阶导数,而XGBoost算法对其进行了泰勒展开,利用了其中的二阶导数项。XGBoost算法作为提升树算法的一种,降低了每次迭代所产生的决策树的权重,这个方法可以有效得降低每棵树对于整体模型的影响,在之后的训练中产生的决策树有更大的学习空间。同时,XGBoost算法借鉴了随机森林中的列采样技术,在降低计算量的同时对过拟合现象也有抑制的效果。作为一个优化的提升树算法,XGBoost算法不仅从准确度上得到了极大的提升,更重要的是其对工程进行了优化,采取了并行运算的方式提升了速度。当使用XGBoost模型进行训练时,模型会提供特征粒度上的并行训练。首先先对特征数据进行排序,再通过分布式原理分配到不同的节点上进行运算,这样可以大大提高整体的效率。本文最后提供了一个在网络数据集KDD Cup 99上最佳的XGBoost模型并评估了其性能。
其他文献
羟基磷灰石(HA)与人类牙齿中矿物相的晶体结构和组成极其相似,具有优良的生物活性和骨组织诱导性,是一种理想的齿科修复材料,因而受到学者的广泛关注。然而,HA的机械性能欠佳,
<正> 在台湾官场,辞职的面貌多种多样,有上下、有阴阳、有黑白,也有真辞与假辞之分。辞职已成为官场的一门政治艺术。 真辞是真的发自内心求去,绝不虚伪打折扣。像50年代,“
目的了解2013年1月1日正式实施GB 28050—2011《食品安全国家标准预包装食品营养标签通则》(以下简称《通则》)后,唐山市超市预包装食品营养标签标示现况。方法参考《通则》
<正> 扶弱济贫,尊老敬老,自古以来就是中华民族的传统美德。我国人民历来把颐养天年、安居乐业视为基本的人生追求。但是目前随着人们生活水平的不断提高,在广大农村的一些地
蛋白质标记荧光探针在生物分析及蛋白质组学中的应用日益广泛,被用于在分子水平上分析和识别蛋白质,检测蛋白质复杂的构象变化及各项生理活动过程如蛋白质之间的相互作用等。
六硝基六氮杂异伍兹烷(HNIW)是高能低特征信号推进剂的首选氧化剂。HNIW自20世纪80年代诞生之后,各国对其能量、燃烧、热分解等性能及其在推进剂领域的应用进行了广泛深入的
<正>食药监办食监一〔2014〕31号各省、自治区、直辖市食品药品监督管理局(质量技术监督局):为了严格婴幼儿配方乳粉生产许可工作,准确把握《婴幼儿配方乳粉生产许可审查细则
针对迷彩、伪装网和烟雾等传统可见光隐身技术的一些缺点,为了探索全天候和复杂背景条件下有效的可见光隐身技术,分析了热致变色、光致变色和电致变色三种智能变色材料的变色
由省委组织部和省委老干部局组织的评选“重视老干部工作的领导干部”的活动开展一年来,涌现出了一大批尊重关心老干部、重视老干部工作的领导干部。经过各级认真评选,有三十
《行政处罚法》第49条、第56条规定行政相对人对行政机关的部分行政处罚行为有权拒绝。拒绝条款在实际运行中遭遇困境,反而有扩大行政相对人受损权益的倾向。拒绝条款不符合