面向内生安全的网络恶意流量识别算法设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:qy313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网原始设计主要用于可信环境,侧重于网络的互连,而缺少对网络安全的考虑。伴随着互联网逐渐走向商用,其面临着严重的安全威胁,而“外挂式”安全机制虽能解决特定安全问题,但却使得网络协议越发臃肿,由此产生了内生安全网络研究。其中,网络流量安全是内生安全的一个重要方向,如何在高效、精确、低成本又兼顾用户隐私的情况下,识别出网络流中的恶意流量显得尤其关键。本文针对内生安全需求,分析了现阶段网络中恶意流量识别的问题与难点,提出了相应解决方案。本文的工作主要包括:(1)针对数据集获取困难问题,本文提出了小样本迁移学习算法EGF(EfficientNet Global Finetune),利用EfficientNet作为骨干模型并结合全局Finetune的迁移学习方法,对比了不同源域数据集预训练的模型权重,随机采样了多种比例的原始数据集中的训练集样本,在同一测试集下进行评测。在USTC-2016流量数据集下,EGF算法利用不同的源域数据进行对比实验分析,结合多种比例的目标域数据采样训练,结果显示EGF在2%目标域数据下能达到91.11%的性能。(2)针对流量数据与模型更新频繁问题,本文提出“蒸馏学习+偏差校正”的增量学习算法 DLDC(Distillation Learning and Deviation Correction),在尽量减少已知类别错误率的情况下,准确率识别出新类别,并随着数据的变化而动态更新模型,缓解了“灾难性遗忘”的影响。实验表明该DLDC算法能够在模型性能下降3%左右的情况下完成模型的更新。(3)针对用户隐私与数据隔离问题,本文提出基于PySyft框架的联邦学习算法Federal-EfficientNet,保护用户隐私和数据安全,在不分享原始数据集的情况下,每个子模型都单独训练独立的数据集最终合并更新模型的参数。本文将Federal-EfficientNet应用到恶意流量检测中,最终实验模拟的50个参与者的联邦学习的结果,比参与者用同样数据集单独训练效果提升13%。本文的这三个研究点解决了如今网络现状下恶意流量识别任务的痛点,为内生安全研究提供了支撑。
其他文献
卫星通信可以在全球范围内实现信息网络的无缝覆盖,是天基信息传输系统中的重要构成部分,也是构建天地一体化网络的战略重点。伴随地面移动通信技术的不断更迭,卫星网络和地面5G网络的相互融合技术也在快速发展。地面用户终端在与网络建立连接之前,需要通过随机接入过程确保自身的上行传输时间和基站保持同步,使得网络的上行帧时序与用户终端发送帧时序对齐。高效率低延时的上行接入是保障终端与网络进行正常通信的前提,因此
对于市场监管部门等面向企业的政府部门,目前针对市场主体数量井喷式增长、新经济新业务蓬勃发展的情况,监管部门需要面对执法力量不足、难以实现信息共享、各部门协同监管困难等问题。尤其是在信息共享方面,各监管部门存在各自的办公系统,且各系统之间关系散乱、数据独立、无法实现有效的数据归集,导致信息孤岛效应。针对以上痛点,本文以为河南省开封市开发市场监管平台数据归集子系统为背景,构建多信息系统间信息共享、双告
由于微结构光纤的结构可以灵活调整,因此表现出一系列优良的光学特性。随着国内外微结构光纤制造技术的提升以及研究的深入,利用微结构光纤来研究和设计各种光学器件逐渐变成热点。目前,已经报道了一系列基于微结构光纤的器件,比如:滤波器、传感器、波长转换器等。本论文分别设计了一种微结构光纤表面等离子体共振(Surface plasmon resonance,SPR)折射率传感器和一种微结构光纤偏振分束器。本论
随着无线网络不断增长的业务需求,蜂窝架构频谱资源受限,回程容量将成为系统瓶颈.为了缓解这种瓶颈,考虑一种特殊的异构蜂窝网络,结合缓存节点的部署、用户位置分布、用户对请求内容的偏好以及缓存节点有限的存储空间,对内容存储及用户关联联合优化问题进行建模分析.将目标函数建模为请求时延的最小化,简单证明该问题是NP-hard的,并设计了基于改进KM(Kuhn-Munkres)的内容放置策略.最后,通过实验比较了该算法与其他基准方案的性能.
随着移动通信技术的不断发展以及5G时代的到来,人们对于移动数据流量的需求不断增加,移动互联网也在极大地满足人们在任意时间、任意地点快速便捷地接入互联网的需求;使用智能设备和移动业务的用户数量也在持续增长。目前,中国有着世界上最大的移动通信市场,伴随着激增的移动用户量,移动通信运营商需要更智能地管理无线网络,以提供更加优质的服务,而准确的预测蜂窝网络基站的流量,能够有效地推动无线网络的智能化建设。伴
带平衡约束的矩形布局问题源于卫星舱设备布局设计,属于组合优化问题.深度强化学习利用奖赏机制,通过数据训练实现高性能决策优化.针对布局优化问题,提出一种基于深度强化学习的新算法DAR及其扩展算法IDAR.DAR用指针网络输出定位顺序,再利用定位机制给出布局结果,算法的时间复杂度是O(n3);IDAR算法在DAR的基础上引入迭代机制,算法时间复杂度是O(n4),但能给出更好的结果.测试表明DAR算法具有较好的学习能力,用小型布局问题进行求解训练所获得的模型,能有效应用在大型问题上.在两个大规模典型算例的对照实
针对海鸥优化算法(SOA)求解精度较低、迭代后期收敛速度慢、易陷入早熟收敛的缺点,提出一种基于混沌映射和t-分布变异改进的海鸥优化算法(CtSOA),采用tent映射策略使初始海鸥种群均匀分布在搜索空间中,采用t-分布变异策略平衡算法的探索和开发能力,综合两种改进策略提高了算法的全局搜索精度和跳出局部极值的能力.在14个测试函数上分别与SOA、其他五种元启发式算法、单一策略改进的SOA以及其他学者改进的SOA进行对比,实验结果表明,综合两种改进策略的CtSOA具有更优的收敛精度和更快的收敛速度.
现在已经是信息化时代,随着当下时代计算机及网络技术突飞猛进的发展,几乎每个公司都会用到不同的公司内部办公管理系统,为人员管理、办公流程、公司信息发布等方面都提供了极大的便利,办公管理系统不仅能够有效地提高各部门的办公效率,还能够更快速的实现各个部门之间的信息流通。本课题设计的流程管理系统通过在流程模板管理页面对流程进行配置,自行定制出执行审批的部门和审批的规则,可应用于各行各业。除流程管理功能外,
多台无人机协同完成野外传感器数据采集的工作中,建立具有精确能耗模型的多无人机路径规划问题模型尤为重要.提出了带转角能耗多无人机路径规划问题(multi-UAV path planning with angular energy consump-tion,MUPP-AEC)模型,该模型考虑了无人机在加速、减速、匀速、转角等飞行条件下的能耗差异.针对MUPP-AEC的特点,提出目标空间聚类离散头脑风暴优化算法(discrete brain storm optimization algorithm in obj
现有关键蛋白质识别算法对生物信息考虑不全面、识别准确率亦有待提高,针对此问题,提出一种高效关键蛋白质识别算法PDWS.首先,结合由亚细胞定位信息获取到的蛋白质位置和蛋白质相互作用网络边聚类系数构建加权网络;其次,依据蛋白质所处亚细胞位置,提出亚细胞定位区室子网参与度指标;最后,融合亚细胞定位区室子网参与度和蛋白质复合物子网参与度指标,多维度度量蛋白质关键性.在DIP和Krogan两个标准数据集上的实验结果表明,PDWS算法性能优于PeC、PCSD等已有算法,可识别出更多特定结构的关键蛋白质,且识别精度分别