论文部分内容阅读
网络协议识别是网络管理、网络安全、网络测量等领域的重要基础,随着互联网迅速普及,新的网络应用层出不穷,越来越多的私有网络接入互联网,大大增加了网络流量的复杂性,在这种环境下,传统的网络协议识别技术面临很多挑战。
对基于端口、基于应用层载荷内容特征、基于流量统计特征和基于传输层行为特征的网络协议识别技术的研究现状进行了分析,分析了这些识别技术中采用的协议特征存在的基础、特征的适用范围、识别技术实现的难易程度等,得出应用层载荷内容特征是最为普遍、准确的协议特征。据此,重点研究了应用层载荷内容特征的提取方法,提出了基于流量的特征字符串提取和基于程序分析的协议多个语法域之间依赖关系特征提取两种方法。在基于流量的特征字符串提取方法中,定义了一种新的特征字符串描述格式,提取应用层载荷内容中固定位置的公共二进制位串作为协议的特征字符串。在基于程序分析的提取方法中,借助二进制程序动态插桩引擎,采用动态污染传播技术跟踪程序对网络协议数据包的处理过程,通过对特定处理模式的识别,提取协议多个语法域之间的依赖关系特征。通过实验对两种特征提取工具进行了验证。针对现有识别技术中协议样本数据获取方法准确性低的问题,设计实现了一个基于主机监控的协议样本数据提取工具,实验验证了工具获取协议样本数据的完整性和工具运行效率。
以本文提出的两种特征提取方法为基础,结合本文作者对加密网络协议识别的经验,采用网络处理器和TCAM存储器,设计了一种适用于高速网络环境的网络协议识别系统,对其识别效率做了分析。