论文部分内容阅读
随着骨干网络向高速化、多样化、复杂化方向发展,与网络流量相关的管理和安全问题越来越复杂,网络流量行为感知利用网络流量特征参数感知网络行为随时间或空间发展变化的规律,成为学术界与工业界共同关注的前沿科学问题之一。数据传输的高速特征、传输信息的海量特征、数据流与应用流的多样化特征及其相互关系的复杂性、各条链路间流量关系的复杂性等多种因素决定了骨干网络流量行为感知的复杂性。本论文围绕国家自然科学基金项目“大规模通信网络异常行为特征分析与提取关键技术研究”(项目编号:60872033)的研究任务,针对单汇接点和多汇接点两类情形,从骨干网络流量行为特征提取、骨干网络流量异常行为理解及骨干网络流量异常行为趋势预测三个层次展开对骨干网络流量异常行为感知的相关理论与技术问题的研究。论文的主要贡献概括如下:1.骨干网络流量行为特征提取问题的研究。由于骨干网络数据传输的高速特征和传输信息的海量特征,精细的逐包分析难以满足在线流量行为分析的要求,必须采用尽量少且相对粗粒度的流量特征参数。针对全息描述骨干网络流量行为的最小特征子集问题,本文采用了流量flow六元组(源目的地址,端口,协议类型,字节数)信息作为骨干网络流量行为感知的基础信息来源,实现了部分反映整体的哲学理念,是骨干网络流量行为感知的前提和基础。针对特征信息的高维特点,提出了一种基于信息熵的子空间分离流量特征分析方法,对海量高维的原始网络流量数据在保持原有的几何拓扑分布的前提下进行信息压缩和简约表示。2.单汇接点情形下骨干网络流量异常行为理解方法的研究。针对具有时频谱范围广、包含多种信息的、非平稳特性的复杂流量信号,通过流量信号的时间和频率的联合函数,从时域、频域同时揭示网络流量信号异常成分。对于一些更复杂的情况,如非线性、非平稳的流量信号,提出了一种基函数由原始信号本身自适应得到的网络流量信号分解方法。针对骨干网络流量行为参数相互关系的复杂性,提出多时间序列分析方法,借助多时间序列提供的相互关系(如波形模式、结构模式等)理解网络流量行为,通过多时间关联数据挖掘算法分析波形符号之间的关联模式来理解异常行为,提高网络流量行为感知能力。针对网络流量行为的挖掘算法性能问题,提出了一种快速的关联挖掘算法,通过减少扫描数据的次数,可提高海量高维网络流量数据的挖掘性能。3.多汇接点情形下骨干网络流量异常行为理解方法的研究。针对跨越多汇接点的异常行为在时间空间上具有相互依赖相互影响的特点,提出通过两阶段时空处理方法提取流量异常特征,运用多时间序列关联挖掘算法提取跨越多汇接点的协同异常在时间空间上的关联模式,提高骨干网络流量行为感知能力。4.骨干网络流量异常行为趋势预测问题的研究。针对短期流量行为趋势的非线性特性,运用基于粒子群优化后向传播神经网络的预测方法,通过粒子群进化获取神经网络学习权值,利用神经网络进行预测。针对采样后包含缺失值和干扰信息的网络流量数据,提出了一种组合灰预测模型,通过子空间分离将原始数据分离到不同的子空间,不同的子空间采取相应的数据处理手段,在此基础上选取少量数据,对骨干网络流量行为趋势进行预测。