基于集成学习的网络入侵辅助取证系统研究与实现

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:iamwoceo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络入侵对个人隐私与财产安全,甚至是国家的安全稳定都造成了极大威胁,网络入侵取证就是通过分析网络流量数据以重现网络入侵行为,从而找出入侵痕迹并将其作为呈堂证供的过程。然而,高维度的海量数据所存在的特征冗余、类别不平衡等问题都对传统取证技术带来了巨大挑战,因此将数据挖掘技术应用于网络入侵取证具有一定的理论研究价值与积极的现实研究意义。本文基于数据清洗和特征选择等手段结合集成学习对实验数据建模分析,并以综合性能最优的模型为核心设计实现了网络入侵辅助取证系统。主要工作如下:1.对原始数据进行数据清洗,分别利用SMOTE和Easy Ensemble采样法对类别不平衡的数据进行采样,并直接利用采样后的数据建立逻辑回归模型。通过对比模型在测试集上的ROC和AUC,最终选用Easy Ensemble采样方法削弱了数据类别不平衡对模型分类效果的影响。2.采取特征排序+搜索策略的方法进行特征选择,通过Pearson相关系数法过滤掉冗余特征后,基于随机森林对特征子集进行重要性度量与排序。并结合贪心算法编码实现序列反向选择算法(Sequential Backward Selection Algorithms,SBS),对特征集进行了有效的特征选择,从而大幅度降低了数据维度。3.利用随机森林、XGBoost和Light GBM等集成学习算法对实验数据进行了建模预测,通过模型评估选出最优模型,采取加权软投票策略对XGBoost和Light GBM模型进行了再次融合,进一步提升了模型性能。同时建立了基于L1正则化特征选择的模型′,通过对比研究,证实了本文特征选择的有效性。此外,建立了代价敏感Ada Cost模型作为备用方案,实现代价因子的改变对精确率、召回率以及F-Measure的调整,以满足不同场合对精确率和召回率的偏好需求。4.针对XGBoost模型参数很多、调整困难且具有较高过拟合风险的问题,引入遗传算法(Genetic Algorithm,GA)对模型参数进行优化。与默认参数和通过随机搜索调参的XGBoost模型相比,GA-XGBoost模型性能得到了有效提升。5.结合最佳网络入侵取证模型,基于Django框架设计实现了网络入侵辅助取证系统。作为对现有专业取证系统的探索性改进,本系统在提供用户管理和数据管理基本功能的同时,引入风险评估模型并结合集成学习模型的预测结果对样本进行风险评估与等级划分,从而给出辅助决策意见。实现取证者对海量数据的快速过滤与可疑样本的精准定位,缩短取证周期的同时提高了取证决策的可靠性。
其他文献
如何进行生命安全与健康教育是道德与法治教师探讨的重要话题。有效开展“生命安全与健康教育”,不妨遵循“生活化”的原则,激发与生活密切相关的学习需求,创设与生活共通互融的教学情境,结合生活实例开展体验活动,真正实现德育知情意行的统一。
以1年生白枪杆幼苗为材料,采用正交试验,分析喷施不同浓度的3种植物生长调节剂对幼苗各器官N、P、K含量及化学计量特征的影响。结果表明:各处理不同器官中N、P、K质量分数及化学计量比存在显著性差异。筛选出最优喷施方案为A2B1C2,ZT浓度为50 mg/L、IAA浓度为50 mg/L、GA3浓度为150 mg/L。叶片中N和K平均分配比例最高,茎中P分配比例最高。适宜浓度植物生长调节剂混合可以提高白
口语交际是当前言语教学中的重要板块,是学习者将听与说的能力运用于不同的场景之中的人际交往活动。口语交际能力是一种综合能力,它囊括了分析、综合、判断、推理和归纳能力,该能力的提升是人的全面发展中不可缺少的一环。因而,在当前义务教育阶段,口语交际在语文学科中被置于显要位置。研究小学低段语文口语交际,符合我国全面培养学生核心素养的现实要求,有利于学生的个性化、全面性发展。研究小学低段语文口语教学的交互性
为改善微机电系统(MEMS)传感器在塑封过程中产生的金线偏移封装缺陷,对MEMS微波功率传感器模塑封工艺参数进行优化设计。通过正交试验,探究金线偏移与模塑封工艺参数之间的关系。结果表明:各工艺参数对金线偏移均具有显著影响,影响程度排序为:塑件温度>注射时间>铸件湿度>铸件温度,最优组合的工艺参数为A3B1C2D3。采用最优组合的工艺参数进行MEMS微波功率传感器模塑封试验,金线偏移量数值可以达到实
分别采用珍珠岩、轻基质和沙质等3种基质和不同生根粉不同浓度以及清水等5种穗条处理方式对半枫荷半木质化枝条进行扦插,结果表明:不同苗床基质和穗条处理方式对半枫荷扦插成活率都有极显著差异,但对苗高影响不显著;不同苗床基质对苗木成活率的影响为沙质>珍珠岩>轻基质;不同生长素对苗木成活率影响为清水>国光牌生根粉2×10-3 mol/L>ABT1号生根粉2×10-3 mol/L>国光牌生根粉1×10-3 m
目的 运用Logistic回归联合ROC曲线评估微小核糖核酸-19b-3p(microRNA-19b-3p, miR-19b-3p)对抑郁症疗效的预测价值。方法 选取本院收治的抑郁症患者112例为研究对象(病例组),另选取同期来本院进行体检的健康志愿者60例(作为对照组)。采用实时荧光定量聚合酶链式反应(polymerase chain reaction, PCR)法检测所有受试者外周血清miR-
极区蕴含丰富的石油和天然气资源,随着各国油气资源的不断消耗,对于极区的开发迫在眉睫,其中漂浮软管是油气开发运输过程中的重要装备。但在极低的自然环境温度下,漂浮软管中的油气流动性变差,甚至会发生结蜡堵塞的现象,因此本文结合漂浮软管及管道电加热技术,提出采用电加热漂浮软管解决极区油气流动安全保障的新思路。本文进行了满足极区条件下的新型电加热漂浮软管初步设计,在不改变漂浮软管几何特性的前提下,针对漂浮软
<正>青教办函[2022]80号为深入贯彻落实《中共中央办公厅国务院办公厅关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》(中办发[2021]40号)、《教育部办公厅关于加强义务教育学校作业管理的通知》(教基厅函[2021]13号)和青海省教育厅有关文件精神,进一步提升作业设计的科学性、针对性和规范性,增强作业实施的有效性,减轻学生作业负担,依据《义务教育地理课程标准》,结合我省初中地
期刊
“1+X”证书制度的提出是国家对高职教育的积极探索,是职业教育特征的显著体现。文章以现代物流管理专业的核心课程智能运输管理实务为例,开展基于“1+X”证书制度的课证融通教学改革路径的探索,分析了课程课证融通的现状,提出了课证融通的改革思路和路径,主要从重构课程知识结构体系、加强课程教学资源建设、创新考评新机制、加强“双师型”教师队伍建设四个方面入手,通过课程改革实现课证融通,使人才培养更加符合企业
本文研究了基于时序参数法的玄武岩纤维增强复合材料(BFRP)板弯曲蠕变行为.为了提高模型理论预测的精度,文中将整个实验时长的数据进行了合理的细化分组,且每组时长尽可能相同,然后对细化分组的数据组分别进行直接外推法拟合,得到各数据组对应的拟合方程参数,最后获得了BFRP板弯曲蠕变行为的理论预测模型.对比模型预测值和实验值可以发现:模型预测值随着时间的增长,越来越接近于实验值,最后二者的相对误差几乎为