高效数据包分类方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:geyukcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据包分类是按照一定的规则集和数据包的域信息,找出与数据包匹配的规则条目的过程。数据包分类技术在防火墙、入侵检测、负载均衡系统、VPN等各类网络设备中都得到了广泛的应用。作为网络设备数据平面的关键技术之一,高性能的数据包分类方法在过去的20年中得到了广泛和深入的研究。传统的数据包分类技术,一般基于特定硬件。然而随着数据中心网络、软件定义网络、业务感知网络等新型网络技术的发展,基于多/众核平台的高效灵活的数据包分类技术开始逐渐成为研究热点。本文主要从算法设计框架、规则集特性分析和算法实现优化三个层面对数据包分类技术进行了研究。  在算法设计框架方面,本文在分析多种典型包分类算法的基础上提出多域决策树包分类算法框架。该框架将决策树算法过程分解成由域选择-域划分-优化方法三类“元”方法所构成,揭示了不同算法内在的联系和区别,为设计更高效的算法提供依据。本文通过混合不同算法的“元方法”,提出HiCuts-op和HyperSplit-op数据包分类算法,实验结果表明,HiCuts-op比HiCuts算法内存占用降低2~20倍,访存次数降低约10%。HyperSplit-op算法比HyperSplit算法内存占用降低2~200倍,访存次数有10%~30%的下降。  在规则集特性分析方面,本文挖掘规则集特性和算法性能之间的联系,发现规则集的“覆盖均匀性”对不同算法的访存次数具有直接影响,规则集内“正交结构”规则的数量将直接决定算法的内存占用。结合所提出的“覆盖均匀性”量化方法和内存估算模型,本文设计了SmartSplit多决策树算法和AutoPC算法策略框架。对比EffiCuts算法,SmartSplit算法的访存次数平均减少1.9倍,内存占用最多下降10倍。对于给定一个规则集,AutoPC框架能够根据规则特性自适应选择合适的算法。与仅使用一种算法相比,AutoPC框架通过为不同规则集推荐不同算法,取得了平均3.8倍的性能提升。  本文还分析了IP转发表中的前缀长度和更新开销之间的联系。本文发现,前缀长度越长,前缀树算法Tree Bitmap访存次数则越多;前缀长度越短,DIR-24-8算法的更新开销则越大。本文通过结合这两类典型的IP查找算法的优势,提出了一种混合算法SplitLookup,改进了已有算法的更新开销。实验结果表明,在更新短前缀时,和DIR-24-8算法相比,SplitLookup更新所需要的访存次数有2个数量级的下降,其分类速率和DIR-24-8接近。  在算法实现优化上,本文在多/众核上实现并优化多种算法,包括IP查找中的DIR-24-8和Tree Bitmap算法、多域包分类中的HyperCuts/HiCuts算法的多种实现变体、Adaptive Binary Cuttings算法、EffiCuts算法、HiCuts-op和HyperSplit-op算法。其中SplitLookup算法在众核处理器TILEPro64上能够达到40Gbps的分类速率,多域包分类算法HiCuts-op和HyperSplit-op算法在通用CPU上能够获得10~20Gbps的吞吐率。
其他文献
开放存取(Open Access,OA)期刊是一种用户可以免费使用的互联网学术信息资源,而且不受任何的访问限制。它为学术科研人员获取学术信息资源提供了一条新的便利途径,对于各个学科
学位
学位
信息中心网络是众多未来互联网体系结构研究中受到广泛关注的一类。与传统基于IP地址的路由机制不同,在信息中心网络中,可独立命名的信息内容成为网络的基本处理单元。路由标识
内存系统一直以来是计算机系统的主要瓶颈之一,随着多核时代的来临,“内存墙(Memory Wall)”问题将更加严峻。准确的访存行为分析是进行内存系统研究的基础,而细粒度的访存行为
学位
以信息为中心的网络(ICN,Information Centric Network)旨在解决现有互联网体系架构在可扩展性、内容传输效率、移动性、安全性等方面的各种问题,它的研究工作正受到广泛关注。
以智能手机和平板电脑为代表的移动设备,逐渐成为最主要的电子消费品,而且仍呈现出迅速发展的态势。从移动平台的角度来看,移动设备的硬件配置如处理器、内存、图像处理器、显示
在数字图像处理中,模糊图像复原具有重要的研究意义和应用价值。由于模糊图像复原是一个不适定问题,使得从模糊图像中恢复清晰图像非常困难。虽然目前大量算法已被提出,但仍然存
学位