论文部分内容阅读
随着云计算、电子商务、网络游戏等Internet应用领域的不断延伸和扩展,目前越来越多的应用需要进行大规模的数据存储和应用处理,网络中的数据已然出现爆炸式的增长。数据中心网络就是随着人们对海量数据的高效存储和处理要求应运而生的。然而,扩展的网络规模和种类繁多的应用服务类型加重了网络操作员对数据中心网络管理的负担。流量矩阵可以完整描述网络中的全部流量状态信息,它不仅可以为学者们研究网络中流量问题提供基本的网络参数,还是多个重要领域的关键输入。但是因为数据中心网络中网络规模较大、结构复杂,网络中的流的行为不稳定,流交互非常频繁,所以直接测量数据中心网络中端到端的流量是非常困难的,并且需要花费较大的开销。网络层析成像技术是近年来提出的一种新的推断网络端到端的测量技术,它是通过易取得的链路数据推断端到端的流量,目前在传统的计算机网络中已有大量的研究成果,然而由于数据中心网络与传统网络在流量特征、交换机扮演角色、大量冗余路径等方面的不同,该技术不能直接应用在当前的数据中心网络。目前针对树型的数据中心网络结构中独特的分层特点,采用分解网络的方式可以降低估计整个网络流量矩阵的复杂性。然而,树形结构的对称性又容易使得收集链路数据过程中存在数据的不完整和不准确性,链路测量误差会对估计误差造成一定的影响。因此,本文主要将层析成像技术和流量矩阵估计作为核心研究问题,提出了拓扑分解下的基于层析重力空间的数据中心网络流量矩阵估计算法。本文的主要研究内容如下:首先,为了降低数据中心网络流量矩阵估计的复杂性,提出将整个网络分解为多个相对独立的网络单元,称之为簇,从而将估计整个网络的流量矩阵降解为估计多个小的网络单元的流量矩阵。其次,结合链路信息和重力模型结合得到数据中心网络的粗粒度流量特征和简单的流量矩阵估计,通过加入附加的链路信息和采用类马氏距离衡量估计误差,提出基于流量特征的层析重力空间的迭代算法(ICGA)。此外,考虑到树形数据中心网络结构具有的对称性和收集得到的链路数据存在适量数据丢失和错误的情况,提出未使用数据中心网络先验流量特征的简单层析重力空间流量矩阵估计算法(SAWP)。最后,搭建了Network Simulator2(NS-2)仿真平台模拟整个实验环境。结果表明:通过对比分析算法的时间复杂度,表明在适量数据丢失下第二种方法比第一种方法更加简单。其次,仿真表明所提的算法在实际测量数据中比其他算法估计更加准确;在少量数据丢失的情景下,提出的两种算法在簇间的流量矩阵估计下性能更相似;当对获得的测量数据加入不同层次的噪声之后,可以发现估计的误差随着噪声层次的增加而增加,但是因为分解之后的网络流量相对更稳定,簇内的误差增加更缓慢。