基于机器学习的加密网络数据分类识别关键技术研究与实现

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:caipeng1999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在通信网络中,对加密数据的有效分类识别对网络监管和安全防护意义重大。对计算机网络而言,网络流量多被定义为具有相同五元组的连续数据包,且传统方法一般基于流或载荷的统计特征对其进行分类识别。而在物联网、卫星通信网等特殊网络中,由于应用的特殊性和网络设备的受限性,使用的通信协议具有结构紧凑、数据传输突发等特点,导致网络中的数据多以离散无序短报文的形式存在,缺乏流统计特征,传统基于流的分类识别方法对其无法适用。同时,由于长度较短,现有基于载荷统计特征的分类识别方法对其效果不佳。此外,随着网络环境的不断变化和加密私有协议的大量使用,数据标签的获取较为困难,在协议规范未知和缺乏标记数据条件下的分类识别难度更大。针对上述特殊网络中的离散加密短数据的分类识别问题,本文基于深度学习对其关键技术展开研究,论文的主要工作及创新点包括:1.当处理对象为公开协议数据时,针对目标数据集协议种类单一且无标记数据的问题,提出一种基于长短时记忆网络(LSTM)和模型迁移的加密网络数据无监督分类识别算法。构建了基于LSTM的分类识别网络,将网络数据视为时间序列,利用公开或生成的源域数据对网络进行预训练,基于模型迁移方法将预训练后LSTM网络迁移至目标数据进行分类识别,并使用动态时间规整(DTW)方法指导源域的选择。实验表明,在Text、ACARS、HTTP&SSH等数据集上无监督分类识别的准确率和F1值均超过96%,同时构建的LSTM网络能够有效解决数据离散、长度较短的问题。2.当处理对象为公开协议数据时,针对目标数据集协议种类混杂且仅有少量标记数据的问题,提出一种基于生成对抗网络(GAN)的两阶段半监督加密网络数据分类识别算法。第一阶段构建了基于GAN的数据筛选网络,基于目标域少量带标记数据,利用GAN中的判别器对源域数据进行筛选;第二阶段构建了基于GAN的半监督分类识别网络,利用筛选出的同分布无标签数据和少量标记数据实现半监督分类识别。实验表明,在以ACARS、AIS1、AIS4、HTTP、DNS、SMTP、FTP和SSH等为源域数据,对ACARS、AIS和HTTP混合数据进行分类识别时,当标记率低至0.06%,准确率和F1值能保持在91%以上,与传统半监督分类识别方法相比,提升超过10个百分点。3.当处理对象为私有协议数据时,针对目标数据集协议种类混杂且无标记数据的问题,提出一种基于数据重构的加密网络数据分类识别算法。提出基于数据重构和卷积神经网络(CNN)的加密概率计算方法,计算整体数据各字节偏移量的加密概率;提出基于离散序列导数的疑似加密字段集生成算法,提取加密概率跳跃点,生成所有可能的加密字段集合;提出基于矩特征向量的加密字段匹配算法,匹配出待测数据所属的加密字段模式,判断数据是否加密的同时提取加密字段起止位置。实验表明,在ACARS(上行和下行)、TLS、SSH、AIS消息1等5种不同协议构成的混合数据集上,正向覆盖度、反向覆盖度和F1值均达到90%,与基于传统方法的匹配结果相比,本文的综合效果最好。4.针对加密网络数据的分类识别实际应用需求,设计并实现一种加密网络数据智能分类识别算法软件模块,可采用离线方式外挂于现有数据平台。根据实际需求设计了软件框架,分析了软硬件条件,实现了数据预处理、加密网络数据分类识别、结果展示和指标统计等功能,并通过实际数据对软件的各模块功能进行了验证。
其他文献
目的:1.体外建立多种血管内皮损伤模型(过氧化氢、高糖、高脂诱导),通过该模型筛选黄花乌头对于修复血管内皮损伤的有效组分,并初步探讨其作用机制。2.体内建立异丙肾上腺素(ISO)诱导大鼠血管内皮损伤模型,观察黄花乌头有效组分对异丙肾上腺素诱导血管内皮损伤大鼠血管内皮的影响。方法:1.三种血管内皮损伤模型的建立(1)不同浓度的过氧化氢(1、2、3 m M)分别孵育血管环10、20、30 min,通过
2015年中央政府工作报告中,“互联网+”充满时代感的崭新字眼走进人们生活的各个方面。2016年11月16日至18日,在浙江乌镇举办的第三届世界互联网大会统计数据显示,我国网民总
近年来,随着生活水平的提升,人们的饮食结构发生明显的变化,全球包括我国在内的肥胖人数逐年递增,已经严重影响到人们的身心健康和生活质量。肥胖症是指体内脂肪堆积过多或分
从我国开始确定改革开放政策的几十年以来,我国在各方面均已经取得了令世界瞩目的成果,特别是在经济建设方面,成果斐然。然而,发展的背后却是以牺牲生态环境为代价的。为了大力发展社会经济建设,我们国家的自然生态环境遭受到了越来越严峻的问题,甚至已经威胁到了公众正常的生产生活。为了保证我国社会经济建设与自然生态环境和谐共生发展,必须通过法律来提高人们对自然生态环境保护的认知。2015年新年伊始,新环保法正式
目的:通过检测不同干预方案下大鼠慢性难愈合创面组织中细胞角蛋白15(cytokeratin-15 CK15)与细胞角蛋白19(cytokeratin-19 CK19)的动态表达,探讨完善皮肤再生医疗技术(moist exposed burn therapy/moist exposed burn ointment,MEBT/MEBO)促进创面愈合的部分分子学机制,从而为其在临床治疗上推广应用提供理论
异构化汽油是一种基本不含硫和氮、无烯烃和芳烃的高辛烷值清洁汽油调和组分,分子筛型异构化催化剂具有原料杂质耐受性强、活性高、异构产物辛烷值高和热稳定性好等多项优点,
三阴性乳腺癌是乳腺癌中恶性程度最高的亚型,由于缺少治疗靶点,目前临床对三阴性乳腺癌的治疗方法局限于化疗以及必要时的手术切除。然而,化疗的效果受限于化疗药物自身清除率快、靶向性差、易耐药和高毒性的缺点。纳米技术的发展为降低化疗药的体内清除速度、提高靶向性提供了可能。但是人工合成的纳米药物对人体而言,依旧是异质性的,仍具有一定的毒性和免疫原性。外泌体作为一种内源性的细胞外囊泡,具有免疫原性低、无毒性和
本文对民间药用植物酸叶胶藤[Urceola rosea(Hook.et Arn.)D.J.Middleton=Ecdysanthera rosea Hook.et Arn.]进行化学成分研究。酸叶胶藤是夹竹桃科(Apocynaceae)花皮胶藤属(Urceola)植物,用来治疗风湿骨痛,慢性肾炎,跌打损伤等症;越南瑶族人用其抗炎及抗感染,京族人则用其来治疗肾结石所导致的慢性肾炎等;现代研究表明酸叶
在中国当代文学史上,王跃文以他独特的文学视角占领了一席之地。以官场文学进入大众视野的王跃文突然笔锋一转,专注于土地经验和农村日常生活事件的书写,给读者带来了一部部乡土巨作。实际上,王跃文并没有单方面对乡土世界进行怀念眷顾,也没有单方面对乡土世界的落后愚昧进行批判审视,而是利用浪漫主义和现实主义相融合的创作手法,既寄予了乡土理想的浪漫乌托邦,又站在理性客观的角度对乡土社会所存在的现实问题进行了深度的
场外商品衍生品监管的特殊性源于交易性质存在特殊性。基于其基础资产为大宗商品类,当以交割实物进行结算时,交易性质不同于场外金融衍生品的价差交易。从市场性质来看,可以对场外商品衍生品交易及市场进行二元划分,以实物为交割目的的交易更贴近现货市场,仅以价差进行结算的交易更符合金融市场属性,类似场外金融衍生品交易。从交易形式来看,场外商品衍生品交易中的远期交易若不被滥用为变相期货交易,至少应有一方市场参与者