论文部分内容阅读
近年来随着互联网的发展,网络流量呈现出多样化、复杂化的特点,给网络服务质量和网络安全的保障带来了前所未有的挑战。网络监管部门无法准确了解网络中的流量信息,就不能采取针对性的管理措施。因此,网络流分类技术对网络管理工作具有重要的作用,研究准确、高效的流分类算法具有重大的现实意义。该领域已有的研究大多只停留在协议级别的流分类问题上,对加密流量的识别也缺乏针对性的解决方案,算法效率也难以达到实际应用的要求。针对这些问题,本文对点对点媒体通道和网络加密服务数据流的实时分类问题进行了深入的研究。首先,本文给出了网络数据流分类问题的形式化定义和评价标准,对三种传统的网络数据流分类算法进行了深入的分析和比较。其次,提出了一种基于支持向量机模型的点对点媒体通道数据流分类算法。通过分析UDP媒体通道数据流的特点,构造了由5个数据流特征组成的特征集合。实验结果表明,该算法具有较强的泛化能力和实时性,对3种媒体通道的总体分类准确率达到了96%。然后,提出了一种基于决策树模型的网络加密服务数据流分类算法。分析了4种HTTPS应用的流量特点,选择前8个报文长度序列作为数据流特征。提出了特征归纳和特征属性交叉区间拆分算法,提高了分类模型的学习和训练效率。在测试实验中,该算法计算简单、具有较快的分类速度,对4种加密应用的分类准确率达到了95%以上。最后,在上述研究基础之上,针对网络加密服务数据流分类问题,设计并实现了一个大流量、高速网络环境下的网络加密数据流实时分类器原型系统。该系统依托于高性能报文捕获平台,可以高速准确地识别出目标网络服务流量,对其包含的各类应用做出实时分类,具有较强的稳定性和较低的资源占用率。