基于DPI的网络业务流量识别技术研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:zhaolong0804
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,互联网飞速发展,网络新业务层见叠出,网络流量也呈现指数级的增长。网络业务流量的精细识别被广泛应用于规划和管理网络,解决网络用塞,预防网络攻击等方面,成为对防火墙等安全技术的有力补充。高速网络的出现对流量识别技术提出了更高的要求,而分布式计算框架对大规模数据的处理能力使其能够更好的应对高速网络流量,从而确保网络环境的通畅。因此,将分布式计算框架应用于网络业务流量识别中已成为新的研究热点。本文阐述了网络流量识别技术的理论,对当下最为常见的网络流量识别技术中包含的端口识别技术、DFI技术和DPI技术进行了深入分析。通过分析网络流量识别的需求,重点研究了DPI技术中的KMP算法、BM算法、WM算法和AC算法,对各种算法的原理以及算法的运算流程进行了对比性研究,提出了一种改进的模式匹配算法--BMF算法,它能够更加快速的进行文本串的模式匹配。伴随着互联网的高速发展,传统的网络结构已经难以适应如今网络新业务的需求,传统的关系型数据的存储和计算也已经难以适应未来海量流量增长的需求,因此应用分布式计算框架对大规模数据流量进行识别是必然的发展趋势,本文根据Hadoop云计算平台的特点设计了基于DPI技术和MapReduce模块的MapReduceBoyer-MooreFast算法的运算流程,将DPI技术应用到Hadoop云计算平台中,最后搭建Hadoop实验集群,抓取数据进行对比实验,实验结果表明,该方法能够有效的识别网络业务流量。  本研究主要内容包括:⑴提出了一种改进的模式匹配算法—BMF算法。BM算法利用好后缀规则和坏字符规则构造两张跳转表,指示字符向右移动的距离,在此基础上,本文对算法的匹配思想进行了优化和改进,舍弃了好后缀规则以及好后缀规则中数据链表的构造,从而简化了算法的运算流程,降低了空间复杂度,重点利用坏字符规则,改进字符匹配方式,增加文本串向右移动的最大距离,降低了文本串向右移动的次数。实验结果表明,BMF算法在不降低匹配准确率的前提下一定程度上提高了模式匹配算法的运行效率。⑵设计了基于Hadoop平台的DPI技术流量识别方案。首先使用抓包软件Wireshark对网络流量进行抓取,提取流量的数据包特征,然后利用Hadoop平台处理大规模数据流量的优势,将 DPI技术与 MapReduce编程框架进行结合,根据其框架特点设计了MapReduceBoyer-MooreFast算法的运算流程,最后搭建相关的实验环境,在Hadoop云计算平台下实现了基于DPI技术的流量识别。实验结果表明,DPI技术在Hadoop平台下不仅提高了流量识别的效率,而且也保证了识别的准确率。
其他文献
Internet的飞速发展使得每个人都置身于一片信息的海洋。面对排山倒海的文字信息,搜索引擎成为人们检索信息的最主要工具。人们在搜索文档时,总会在心里怀着一些问题,即使是像Go
面对激烈的市场竞争,各汽车厂商都需要一套硬件在回路的仿真系统,以提高汽车防抱制动死系统(ABS)的性能,缩短研发周期,降低研发成本。本文选用转弯制动中的汽车作为控制对象,对该
联机手写识别的根本任务是模式分类,即通过数字设备采集手写输入信号,从中提取输入特征,加以分类识别词典中的文字。但是由于手写体笔迹变动非常大,精确识别比较困难。特别是
随着基于Intemet的分布式系统的不断发展,面向服务的计算(Service OrientedComputing)正逐渐成为构建基于Intemet应用的新的开发模式。服务(Service,如WebService或Grid Servic
随着信息时代的到来和Internet的发展,信息处理能力成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻译工作越来越迫切,并且工作
随着教育机器人在教育教学实践中的推广和普及,面向教育的虚拟机器人研究受到的关注也越来越多,然而目前对虚拟教育机器人的研究多集中在图形化编程和物理仿真阶段,忽略了机器人
数据挖掘可视化技术包括数据挖掘技术与可视化技术,它首先来自于科学计算可视化。OLAM是数据挖掘(DM)与OLAP技术的有机结合,充分利用了二者的优势,克服二者的不足。本论文所
该文对无线传感器网络的最新进展进行了跟踪,对现有的数据扩散算法进行了详细的介绍和分析,设计了一套以数据为中心的网络应用系统的开发框架,并应用该框架完成了directed di
随着移动通信技术和GIS 技术的发展,人们生活水平的逐步提高,位置服务在国内逐渐兴起。由于国内电信运营商拥有无线网络设施、高精度定位系统以及多种增值业务系统,他们在发
随着网络使用的普及以及信息技术的不断进步,Web应用已逐渐成为一种主流的应用模式,如何确保Web应用的可靠性显得越来越重要。Web应用的特点是体系结构复杂、代码量大、页面众