论文部分内容阅读
为精确高效地识别加密类业务流,给出了一种基于机器自学习的互联网加密业务流早期识别方法。该方法利用加密前后变化不明显的流量统计特征结合机器自学习方法进行识别。首先基于特征与业务类型的互熵来遴选出最优特征用于分类;然后利用所选特征给出了加密业务流总体识别模型,并对模型中的自学习阶段及识别阶段进行了创新,仅选取最能反映协议特点的每条业务流的前几个数据包进行早期识别,达到了对加密业务流高效识别的效果;最后对识别方法进行了性能分析和实验,实验结果表明,基于所选取的最优特征,仅利用每条流前5个数据包即可得到90%以上