论文部分内容阅读
移动网络数据终端的用户数量随着城市无线局域网和第四代移动蜂窝数据通信网络的发展呈现不断增长的态势。移动网络数据终端能够便捷的访问互联网,并通过即时通讯软件进行通讯,移动网络数据终端上的即时通讯软件已逐渐取代了短信息、电话的的主要地位,成为了用户进行日常通讯的首选。移动终端用户数量的不断增大导致即时通讯需求不断扩大,各种即时通讯软件不断产生。各种即时通讯软件由于其自身不同的功能与性能需求,采用了自行设计的私有协议。出于网络管理、网络服务质量保证、隐私保护、舆情监控管理、国防等目的,需要对即时通讯软件进行有效的监管。由于即时通讯软件没有采用公开的已有协议,而是使用了私有协议,并且没有公开协议的具体信息,因此为了对即时通讯软件进行的监管,需要对私有协议进行检测识别与分析。 本文从即时通讯软件的检测和分析两个方面进行即时通讯软件的研究。在即时通讯流量的检测工作中,对流量检测所需要的包数量进行研究。通过利用信息论中的互信息理论对数据包中携带的用于流量分类的信息进行分析,找出能够为流量分类提供最多的流信息的数据包数目。利用多种机器学习分类器对流量进行分析,对各种机器学习分类器在不同包数目下分类能力进行研究。利用弗里德曼检验和威尔科克森符号秩检验两种统计学检验方法以及基于混淆矩阵的分类性能评价方法对机器学习分类器的分类能力进行分析,并得出使各种机器学习分类器达到最佳分类状态时用于检测的包数量。在即时通讯协议分析工作中。 利用 Petri 网以及颜色 Petri 网对协议进行形式化的分析,通过网模型的分析方法得出协议的性质。将协议受到的攻击行为转化为网中插入的新元素,利用网模型对应的矩阵运算完成协议攻击成功的可能性分析,使得协议性质的分析与安全性的评价有了形式化的方法,避免了人工分析的不确定性和局限性。 最后给出了即时通讯流量检测分析的系统实现方案,系统通过包数量选取、多种机器学习分类器的集合使用以及Petri网的分析过程,实现对即时通讯软件协议数据流的识别分类并对软件通讯的消息进行还原。