论文部分内容阅读
网络流量分类是多项网络研究工作的前提和基础,一直是网络研究领域的热点问题。近年来,随着互联网技术的发展,新型网络应用不断涌现,给现有的流量分类技术带来了一系列挑战。本文针对现有网络流量分类研究中急需解决的关键问题展开了研究工作,取得的成果和主要贡献如下:
1.针对现有P2P流量传输层识别方法在国内网络环境中的不足,提出了3条改进策略。通过在实际网络流量记录上进行实验来验证上述改进策略的有效性,实验结果表明:改进后的识别方法能够有效适应国内网络环境,相关的准确性指标都在95%左右。
2.提出了一种基于C4.5决策树的流量分类方法。该方法利用训练数据集中的信息熵来构建分类模型,并通过对分类模型的简单查找来完成网络流样本的分类。理论分析和实验结果都表明:利用C4.5决策树方法来处理流量分类问题在分类稳定性和数据处理效率上具有明显的优势。
3.提出了一种基于时间无关属性的P2P流量识别方法。该方法仅使用16种时间无关属性,可以有效避免网络异常状态对分类稳定性的影响。与包含时间相关属性的流量分类模型进行对比,实验结果表明:仅使用分组数量相关属性和分组长度相关属性的流量分类模型已经能够有效区分P2P流量和非P2P流量。
4.设计并实现了一种实时流量监测系统。该系统改进了基于特征字段的流量分类方法,实现了网络流量的实时在线分类,为社区宽带综合业务接入系统提供了一个实用的流量监测方案。