论文部分内容阅读
网络流量测量和监控是网络管理的一个重要内容,流记录信息对于分析网络行为特征等具有重要意义,但是随着高速网络的大规模应用,同时受处理器速度、缓存容量、网络带宽等硬件条件的限制,试图获取所有在高速链路中传输的报文信息已不再可行,因此在实际的测量中,很多大型网络都采用了抽样技术测量流量,从统计学角度获得对流量总体行为的认识。
基于网络测量某些实际应用的需要,估计出实际网络中传输的流量信息对于深入的进行网络行为的研究有重要的意义。通常情况下,对于网络中传输的流的报文数、字节数估计的做法是直接将抽样流的报文数、字节数分别乘以抽样比,而对于网络传输的总流数的估计是直接采用抽样流的流数来近似代替。传统的流量估计方法对于网络中实际传输的流的报文数、字节数及总流数的估计往往具有较大的估计误差,因此本文在传统流量估计方法的基础上提出了一种新的报文数、字节数及流数的估计方法。
本文主要做了以下几方面的工作:一、流的报文数的估计。TCP流的报文数的估计是将抽样的TCP流按照平均报文大小划分为不同的区间,采用TCP序号和抽样比的混合估计方法;UDP流的报文数估计则仍然采用传统的抽样比估计方法。二、流的字节数的估计。TCP流的字节数估计则完全采用TCP序号的估计方法,而UDP流的字节数的估计则仍然采用传统的抽样比估计方法。三、总流数的估计。对于原始未抽样流的总流数的估计则是根据不同流长的网络流被抽中概率的不同将流分为长流和短流,对于原始未抽样长流流数的估计直接使用抽样长流流数来近似代替,而对于原始未抽样短流流数的估计则是将短流分为TCP短流和UDP短流,TCP短流流数的估计采用的是基于TCP报头信息估计方法,而UDP短流流数的估计则采用的是基于EM算法的估计方法。本文最后还设计与实现了流量估计系统,并对流量估计结果进行了分析对比。