论文部分内容阅读
准确识别网络流量的类型,是网络监控与管理领域的基础问题,也是研究中的热点与难点之一。随着网络上的流量越来越多,流量的类型越来越复杂,传统基于端口的分类技术与基于负载信息签名的分类技术越来越无法满足网络分类的要求与发展,因此基于流统计特征的网络流量分类技术也逐渐受到了更多的重视。本文在分析与总结国内外相关研究的基础之上,对基于流统计特征的网络流量分类技术进行了深入研究。本文的主要工作如下。一方面,提出了一种基于网络流统计特征的分类方法。该方法从只包含数据包的原始流量中提取网络流与基于流的统计特征,随后使用基于K-means的聚类机器学习算法从网络流中获取流量簇,最后使用相关流与多数投票相结合的方式,对流量簇的类型进行标记。基于公开数据集的实验表明,本方法可以达到较高的分类精度与F-measure值。另一方面,提出了一个基于流统计特征网络流量分类的一般性工作流程框架,并在此基础之上提出了一种网络流量分类优化方法。首先通过分析与总结前人相关成果,提出了一个基于流统计特征网络流量分类的一般性工作流程框架。其次在此一般性工作流程框架基础之上,先使用过滤器策略对分类过程中的统计特征进行筛选,再将封装器策略与启发式特征搜索算法相结合,应用序列前向搜索得到一个最优特征集,最终使用此最优特征集完成分类工作。基于公开数据集中不同数据片段的实验表明,该方法总是可以得到一组稳定的最优特征集;基于最优特征集的分类实验表明,优化后的分类方法在保证分类准确率的前提下,可以获得更好的时间效率。综上所述,本文提出了一种基于流统计特征的网络流量分类技术,构造了一个一般性的工作流程框架,并基于此框架提出了一种网络流量分类的优化方法,借助本优化方法可以有效提升分类速度。