面向移动应用的流量特征提取技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:fiscar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的普及与发展,移动应用程序的规模快速增长。如何高效、准确地识别移动应用的流量,对于网络运营商、网络安全服务提供商具有重要的意义,这是研究差异性服务、流量控制、入侵检测、恶意应用识别以及用户行为分析的前提和基础。由于移动应用的开放性以及数据来源的关联性和多样性,对移动应用网络流量的识别十分具有挑战性。为了能够有效识别移动应用网络流量,必须获取移动应用流量中存在的有别于其他应用的细粒度特征。鉴于移动应用主要基于HTTP/HTTPS协议进行数据传输的实际,本文分别对移动应用HTTP流量和HTTPS流量特征提取技术展开了相关研究。本文主要工作如下:(1)本文基于Netlog标签化流量采集工具,在多样化的环境下,采集了42种常见Android应用的流量构成研究数据集。Netlog使用Android提供的VPN Service模块监听设备上所有应用的接口,能够将网络流量映射到具体应用。42种常见应用即包含数据独立性较高的应用,也包含数据关联度较高的同一公司、同一体系下的应用,十分具有代表性。本文构建的移动应用网络流量数据集可用于移动应用流量识别研究。(2)为了能有效识别不同移动应用的HTTP流量,尤其是同一体系下关联度较高的应用流量,本文提出了一个应用ID与结构化特征相结合的移动应用HTTP流量特征提取方法。首先,从应用市场获取移动应用ID构建特征,应用ID是操作系统识别应用的唯一标识。其次,对于应用ID特征不能识别的HTTP流,本文提出了先聚类再提取结构化特征的方法,避免了预先设计特征结构所引起的特征精度低等问题,结构化特征代表了应用的一类高度相似的网络数据交互行为。实验结果表明本文提出的方法对于移动应用HTTP流量具有较好的识别效果。(3)对于移动应用HTTPS流,本文在详细分析其实现机制的基础上,提取TLS握手阶段客户端产生的报文中的各项参数来构成HTTPS特征。实验结果表明,本文提出的特征提取方法,对移动应用HTTPS流量具有一定的识别效果,是一种使用DPI技术进行应用HTTPS流量识别的探索。
其他文献
随着深度学习的不断发展,基于深度神经网络的应用越来越广泛,并在很多应用领域上取得巨大成功。但是,由于神经网络模型尚缺乏合理的可解释性,导致基于神经网络的系统在安全性和可靠性保障上面临巨大挑战。鲁棒性(Robustness)是衡量神经网络模型安全性和可靠性的重要属性。当前研究重点关注的是神经网络的局部(Local)鲁棒性,即神经网络模型N在给定样本x0以及扰动范围δ的前提下,样本空间中满足‖x-xo
以高速磁浮列车主动导向系统为研究对象,在建立基于搭接结构的导向系统数学模型的基础上进行控制器设计与仿真实验。针对导向系统在列车实际运行过程中可能出现的电磁铁故障和传感器故障以及端部涡流问题展开容错控制方面的研究。主要内容如下:1、在分析导向系统的结构组成、工作原理及控制方案的基础上,建立了导向系统的标称数学模型。并把系统可能受到的扰动和发生的故障考虑到其中,建立导向系统的故障模型。2、采用线性二次
随着互联网的飞速发展,用户、企业、运营商和政府对网络的要求也越来越高,这其中既包含了对服务质量的高要求,也包含了对网络安全的高要求。大量测量机构对互联网展开了大规模的测量,得到了海量的测量数据,这些数据中隐藏着互联网的拓扑结构、连通特性、基础设施运行状态等等诸多信息,研究者通过对这些信息的挖掘与分析,为网络建设和网络安全提供帮助。与此同时,也有很多研究者利用这些数据对互联网协议、路由等展开研究,以
作为众多深度学习中最热门的算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机诸多应用中都取得了很大的成功,广泛应用于语音识别、图像分割、图像识别等领域。为了提高网络性能,网络层数和规模逐渐增加。但是,简单地依靠网络层数增加的方式遭遇到了瓶颈,因此一些新型卷积神经网络相继被提出,比如反卷积神经网络和复杂连接的卷积神经网络。这些网络模型的结构更加复杂,
多智能体系统是分布式人工智能的一个重要分支,在无人系统协同、资源管理、队形控制等领域有着广泛的应用。近年来,深度强化学习被应用于多智能体领域,在应对动态开放环境、知识可迁移等方面表现出显著优势。然而,当前多智能体深度强化学习方法在应用中也存在如下问题:(1)训练过程中的过时经验问题。深度强化学习的训练依赖历史经验,然而在多智能体场景下,所有智能体的行为策略都在动态进化,使得单个智能体经验回放池中的
石墨烯作为最薄的二维材料之一,具有硅等传统材料无法比拟的优越特性,超高的杨氏模量与载流子迁移率、优良的压阻效应使其在压力传感领域拥有广阔的应用前景。现有研究已实现压阻式悬浮石墨烯薄膜压力传感器制备并达到了较高的灵敏度。然而,已有石墨烯压力传感器存在理论模型指导不准确、器件成品率低、受温度影响大等问题。针对这些问题,本文主要研究悬浮石墨烯薄膜压力传感器优化设计方法,包括改进传统压阻效应模型,并将其用
网络测量算法是网络应用的基础,在计算机网络中扮演着十分重要的作用。在大数据、云计算背景下,网络流量大幅增长,传统的网络测量算法都是在控制平面内基于CPU采样实现的,准确性低。软件定义网络的提出为网络测量算法提供了新的思路。软件定义网络提供的可编程数据平面使得网络硬件的报文处理功能可以通过软件的方式定义,用户可以灵活地在数据平面内进行编程,将网络报文的转发与网络测量任务结合起来。可编程数据平面高吞吐
随着网络化的高速推进、移动端的快速普及、以及用户之间频繁的信息交互,信息冗余现象渐渐引起了很多研究人员的关注。一方面,重复的信息分享与转发行为降低了用户使用平台的体验感;但另一方面,用户之间的同伴影响和社会强化效应也为信息扩散和影响力最大化提供了可能。本文聚焦在线社交平台中的信息重复发布(冗余)现象,关注信息传播过程中产生的覆盖与强化效应,主要开展了以下工作:(1)详细描述了在线社交网络中的信息冗
近年来,各类社交网络不断发展,它为人们复制了现实社会关系,拓展了人际交往范围,带来了丰富的娱乐体验,被普遍应用在工作和生活的方方面面。我们越来越倾向于在社交网络上享受各种服务,然而随之出现的各类数据泄露事件却让我们对个人隐私感到忧虑。本文研究分析了社交网络中的隐私保护机,对以下几个方面进行改进:(1)结合IPFS文件系统,对社交网络数据进行去中心化存储。现在服务商使用中心服务器管理社交网络的运行,
优化问题伴随着管理决策科学不断发展。一些经典的最优化理论开创了优化理论研究的先河,科学地描绘了最优解的特征。但是,直到有了计算机,人们才能够对各类较大规模的优化问题利用计算机实施求解,从而使对最优化问题的求解成为在实际生活中进行决策、管理中的有效工具。而随着计算机体系结构和各种新型架构的发展,各种异构体系结构产生的运算能力越来越强。如何利用巨大的算力、利用并行加速技术,有效提升优化问题的求解性能,