论文部分内容阅读
VoIP是建立在互联网上的通信模型,传递用户通信的语音、视频及文本信息。VoIP有别于传统电话,也更优于传统电话。首先,提供多样性的服务。传统电话仅局限于提供语音服务,VoIP除提供语音服务外,还提供视频和文本传输服务。以及为多用户提供视频会议服务。其次,提供比传统电话更方便快捷的服务。随着互联网的普及,无线服务覆盖面积的快速增长,用户能够不受时间空间的限制,使用VoIP服务。更重要的是相较传统电话服务,VoIP业务更加便宜。最后,可扩展性更强。使用不同VoIP协议标准开发的应用程序之间可以相互通信,并且能够与传统电话通信。这些优势推动着VoIP的迅速发展,用户增多的同时,伴随着管理方面问题的出现,而有效管理VoIP的基础是通过流量检测,区分正常流量和非法流量。本文首先简要介绍了VoIP及其相关协议标准和技术,阐述流量识别的重要性,分析当前常用的几种VoIP流量识别方法。常用的方法主要是基于分析主机和流量行为特征分析,还有一些是通过分析VoIP传输时使用的协议实现。在此基础上,本文提出基于机器学习的流量识别方法。该方法对已知流媒体流量的特征进行提取,在246个备选特征集合中,选择用于贝叶斯网络训练的核心特征向量。然后利用贝叶斯网络训练原始流量样本,结合特征向量达到VoIP流量识别的目的。即分离出VoIP及其他软件等正常流量,同时区分非法流量,例如受到DoS攻击的流量。通过实验数据分析,并与其他流量识别方法对比,该方法精度、查准率和查全率等指标都较高,能够准确识别VoIP流量。最后分析输入特征个数与VoIP流量识别方法精度之间的关系,以达到在最少输入的情况下获得最大精度,同时降低识别方法运行时间复杂度和空间复杂度。随着云计算技术及其他通信技术的快速发展,网络产生的流量呈指数增长,同时实时监控的需求在不断提高。本文提出的方法为海量数据和实时监控也提供了值得借鉴的理论和模型。