基于深度学习的加密流量算法识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:squallleo2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习做为人工智能领域的一种方法,由于其端到端的网络化结构,可以自动化的进行特征提取步骤,从而避免专家经验参考,人工设计特征的步骤,并且让训练的模型具有很强的泛化能力,近年来被尝试应用在加密流量识别算法研究中。因为相关的工作在业界还在发展阶段,所以存在着一些问题;(1)加密流量相关的公开纯净数据集比较少,并且因为捕获的流量本身没有原始应用标签,无法直接抓取流量进行实验;(2)如何选择合理的方式将加密流量数据转化为深度学习模型输入业界没有统一的标准,并且截取流量的字节长度与数据包个数等相关研究较少;(3)深度学习的发展带来了多样化的模型,如何选取合适的网络结构与模型进行加密流量识别;(4)因为网络流量数据的天然不平衡性,在模型的收敛与训练过程中需要选择合适的目标函数与超参等。本文针对加密流量识别领域中的上述问题进行了详细的研究,建立了从纯净数据自动收集打标到体系化的深度学习加密流量识别建模,以及后续模型优化的整体流程。本文主要研究内容与工作如下:就纯净流量数据集较少问题,本文基于ADB系统脚本化操控安卓手机设计了自动收集纯净流量的系统N-CD。实现了安卓系统自动产生所需应用的加密流量的功能;根据本机应用产生的流量与进程的端口号一一对应的映射关系,成功获取到有应用背景信息的流量数据,让N-CD实现了零错误,零漏包的固定端口加密流量数据收集与提纯。为以后的加密流量研究提供了便利。对卷积神经网络在加密流量识别领域方面进行了更深的研究,在基于加密流量统计的特征的机器学习识别方法中,人工设计的特征不仅对专业的知识要求很高,并且过滤了一些信息特征,从而可能失去全局最优解,所以近年来研究者们通过端到端的深度学习神经网络对加密流量进行分析。因为该种深度模型结构可以将特征提取,选择,组合,分类的过程一体化,从而不过滤样本的特征信息,所以更有可能设计出达到全局最优解的识别模型。本文设计了符合加密流量数据结构特征的卷积网络,增加了Iception和Caps Net的网络层结构,提高了模型的多维特征提取能力和强大的特征位置捕捉学习能力,对比基础的CNN模型识别的加密流量准确率提高了5%。同时为了改善网络流量样本不均衡问题带来的负面影响,对模型的梯度优化方式与目标函数进行了多次实验与设计。本文的实验结果在准确率,识别率方面与了相关文献的在几个数据集上的结果不相上下,但是其模型的泛化能力与便捷性更胜一筹。因为加密流量的通讯交互过程与人类自然语言领域的对话的高度相似,本文基于Elmo+LSTM+Self-Attention对加密流量进行研究,为了更好的利用网络流量在通讯时数据包间的时间序列特征信息,本文使用了时序神经网络LSTM来对加密流量进行识别,考虑到加密套件的多样性与数据包间的时序特征的相对位置关系,增加了ELmo和Self-Attention的网络层结构,该网络模型可以充分的学习流量的交互协议特征与时序信息特征,在公开数据集上的识别结果超过了大多数需要手工设计特征的机器学习方法,其良好的实验结果证明了时序神经网络在加密流量识别领域的可行性。在卷积网络与时序网络在加密流量识别都取得了很好效果的基础上,本文使用卷积与时序的组合神经网络对加密流量识别进行研究,模型左侧通过卷积网络学习加密流量的内容结构特征,模型右侧通过通过时序网络学习加密流量的时序通信特征,然后将两种特征组合进行识别。并根据实验结果研究了网络流截取长度,数据包截取个数,流量划分形式等参数对识别结果的影响,选取了最优的组合形式,并且其识别效果对于单纯的卷积或时序有3%的准确率提升,超过了之前所有的机器学习方法,并且证明了模型结构的优化可以提高识别效果,规范了深度学习识别加密流量的流程。
其他文献
在市场复杂多变、产品定制现象突出的制造行业中,随着需求的日益多样化和交货期竞争的逐步加剧,传统的供应链管理方式已无法适应市场竞争的需要,企业必须提高整个供应链的敏捷性,通过缩短产品交期去快速响应市场变化,才能在激烈的市场竞争中扩大市场份额,并为企业带来持续增长的经济效益。供应链协同管理作为一种新型管理方式,运用协同管理的理念,强调供应链企业之间协同运作,改变了传统供应链管理中链式的信息传递和决策过
当前,技术创新成为助推我国经济转型升级的重要动力,逐步受到社会各方的关注。由于技术创新具有公共产品属性、外部性、不确定性等特征,政府通常采用提供R&D补贴的方式以提升
过渡金属氮化物已经大量应用于工业制造领域,特别是材料的超硬涂层、材料结构的陶瓷、微电子、超导、物质反应的催化剂以及光电太阳能材料。本文主要运用基于密度泛函理论的
脑机接口(Brain Computer Interface,BCI)利用现代信息处理技术,在人脑和外部设备之间建立了不依赖于常规大脑信息输出通路的全新对外信息交流和控制技术,为人机交互方式提供
从正演模拟角度出发,研究胜利油田东辛油区复杂低序级断层波场特征。针对工区断层形态和组合样式,建立不同参数的二维速度模型、衍生断层模型和三维典型组合样式模型。利用声
粗糙脉孢菌(Neurospora crassa)是实验室使用最为普遍的模式真菌之一。属于粪壳科脉孢菌属,是一种常见的多细胞丝状真菌。其菌丝多核,透明,附有桔色的分生孢子。研究粗糙脉孢菌
行业收入差距会导致收入分配的不平等,全要素生产率水平是经济体发展的重要源泉,两者对于经济社会的发展都具有重要影响。近年来,关于行业收入差距对全要素生产率的影响关系也受到了学者的关注,该领域的研究对于经济发展具有重要的政策含义。本文以长江经济带为研究对象,分析行业收入差距对全要素生产率的影响,对于探索长江经济带高质量发展的路径具有重要意义。本文在综述行业收入差距与全要素生产率的相关研究成果基础上,从
青年学生是国家的希望与未来,他们的生活方式与行为习惯是其性格形成的重要影响因素,同时也与社会经济可持续发展和实现中华民族伟大复兴的“中国梦”紧密相关。2017年8月教育部印发关于《中小学德育工作指南》的通知中,明确提出生态文明教育是德育内容的重要一环,其中引导学生形成低碳环保、健康文明的绿色生活方式尤为突出强调。结合思想政治学科鲜明的德育性和时代性特点,思想政治课堂必然成为培育学生树立绿色生活理念
羽扇豆醇(lupeol)是一种常见的五环三萜类化合物,是植物特有的次级代谢产物,广泛存在于水果、蔬菜和中草药中。羽扇豆醇具有抗氧化、抗恶性肿瘤增殖、抗炎症、诱导细胞凋亡和降低胆固醇等多种药理活性,被广泛应用于肿瘤的预防和治疗。但是大部分五环三萜类化合物天然产量极低,且大多是从植物中直接提取,对植物资源有很高的依赖性和破坏性。依靠化学合成则面临成本高、副产物多、毒性大等限制。使用生物技术手段既可以提
创新是增强国际竞争力之关键,也是国家实现经济发展的长久动力。党的“十九大”明确提出要将我国建设成为创新型国家,早日跻身创新型国家前列。一个国家的开放程度对区域的创新水平有着重要的影响,近年来,我国在注重实施创新型战略的同时,不断继续加快对外开放的进程,统筹国内国际两个大局,形成全方位的对外开放新格局,其中,内陆开放型经济的建设是我国实现全方位对外开放新格局至关重要的一步。已有很多学者具体研究了区域