基于报文信息的流量抽样估计方法

来源 :东南大学 | 被引量 : 0次 | 上传用户:ltt3221340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络流量测量和监控是网络管理的一个重要内容,流记录信息对于分析网络行为特征等具有重要意义,但是随着高速网络的大规模应用,同时受处理器速度、缓存容量、网络带宽等硬件条件的限制,试图获取所有在高速链路中传输的报文信息已不再可行,因此在实际的测量中,很多大型网络都采用了抽样技术测量流量,从统计学角度获得对流量总体行为的认识。   基于网络测量某些实际应用的需要,估计出实际网络中传输的流量信息对于深入的进行网络行为的研究有重要的意义。通常情况下,对于网络中传输的流的报文数、字节数估计的做法是直接将抽样流的报文数、字节数分别乘以抽样比,而对于网络传输的总流数的估计是直接采用抽样流的流数来近似代替。传统的流量估计方法对于网络中实际传输的流的报文数、字节数及总流数的估计往往具有较大的估计误差,因此本文在传统流量估计方法的基础上提出了一种新的报文数、字节数及流数的估计方法。   本文主要做了以下几方面的工作:一、流的报文数的估计。TCP流的报文数的估计是将抽样的TCP流按照平均报文大小划分为不同的区间,采用TCP序号和抽样比的混合估计方法;UDP流的报文数估计则仍然采用传统的抽样比估计方法。二、流的字节数的估计。TCP流的字节数估计则完全采用TCP序号的估计方法,而UDP流的字节数的估计则仍然采用传统的抽样比估计方法。三、总流数的估计。对于原始未抽样流的总流数的估计则是根据不同流长的网络流被抽中概率的不同将流分为长流和短流,对于原始未抽样长流流数的估计直接使用抽样长流流数来近似代替,而对于原始未抽样短流流数的估计则是将短流分为TCP短流和UDP短流,TCP短流流数的估计采用的是基于TCP报头信息估计方法,而UDP短流流数的估计则采用的是基于EM算法的估计方法。本文最后还设计与实现了流量估计系统,并对流量估计结果进行了分析对比。
其他文献
随着人工神经网络理论研究的不断深入,因其具有存储、计算和自适应学习等能力,已在许多领域得到广泛应用,利用神经网络模型与算法进行信息处理更是随处可见。MATLAB是当前最
随着我国城市化进程的不断加快,尤其是二十一世纪以来,城市公路交通系统的压力不断加大,传统的人工监控已经不能满足时代发展的需要。因此,智能交通系统的重要性日益显著,特
建筑节能是当今社会普遍关注的热点问题之一,建筑节能控制系统的建立为实现建筑物有效节能提供了一个新的方向。建筑节能控制系统是伴随着智能建筑的发展而产生的,特别与智能
颅骨是人体骨骼中最重要的部分之一,对脑组织起到保护和支撑作用,一旦颅骨缺损或畸形,将给患者的各项生理功能造成障碍。临床上广泛应用的颅骨缺损修复技术主要步骤为借助患
文本聚类是数据挖掘领域中的一个重要分支,尤其在信息量迅速增长的当今社会,文本聚类能够在人们日常的生产生活中起到重要作用。国内外围绕着文本聚类这一课题进行了大量的研
算法与协议成为应用密码学研究的两大重要的组成部分,算法的研究就是通过数学的理论对数据进行加/解密的运算以及对其运算方法进行改进,使其达到现代快速发展的计算机及网络
随着互联网的迅速发展和网络经济的不断繁荣,Web2.0的到来,个人计算机的普及,并行计算、分布式计算、网格计算、P2P计算的发展和融合,一种新的计算模式----云计算应运而生。
语音识别是一门交叉学科,它与语音学、语言学、数字信号处理、模式识别、最优化理论、计算机科学等众多学科紧密相连,是一门既有理论价值又有实际意义的学科。语音识别发展了
心血管疾病是当今危害人类健康的主要疾病之一,心电图检查是临床上诊断心血管疾病的重要方法。心电图准确的自动分类对于心血管疾病的诊断起着关键作用。聚类分析是非监督模
同时多线程处理器(SMT)允许同时从多个线程取指令执行,可以使线程间的线程级并行性以及线程内的指令级的并行性得到了充分的挖掘。在减少指令槽的水平浪费的同时,也减少了垂