论文部分内容阅读
网络的发展日趋复杂,保障网络的安全已成为国家信息化战略的核心内容。在特定的网络环境下,通过特殊手段进行窃密的威胁日趋严峻,此类窃密途径通常是通过无线通信的方式发送涉密信息,且这种通信采用的协议均为非常规的专用未知协议,而现有的防范措施基本只针对已知协议,大多采用基于端口映射或静态特征匹配等方法,无法对该类窃密渠道进行监测和检测。为了保证网络的安全运行以及对攻击与危害行为的预警,需要为决策者提供一种能高效地对未知协议进行识别的方法。在电子对抗的环境下,从截获的通信比特流序列中进一步识别未知协议是一个重要的课题,但是在比特流数据中识别未知协议的技术没有现成的研究成果。本文所研究未知协议一般来说应该具有一定固定的格式,而非格式规律完全无法寻找,所以当截获到同种未知协议大量的原始数据时,就可以通过一定的方法和技术手段对其进行分析,对其中的规律进行寻找。从海量比特流数据中识别未知协议的基本方法是对比特流数据进行挖掘,寻找其中的特征序列,在没有先验知识的情况下,要快速对频繁序列进行提取,本文通过对多模式匹配算法进行改进,仅通过一次扫描就得到所有模式的统计结果,极大地提高了频繁模式寻找的效率。同时,对于某些专用协议,不能通过盲解调和解码的方法对其进行数据帧定界和切分,本文在频繁模式提取的基础上,结合协议自身的特点,有效地解决这一类情况。若在没有任何先验知识的情况下,直接利用提取的频繁序列作为协议类型特征对协议进行识别,误识别率较高,识别效果不明显。本文引入关联性分析的概念,对提取的协议数据帧频繁序列之间的关联性进行考察和验证,通过频繁特征之间存在的关联性对协议类型进行识别,最后,本文基于生物信息学中多序列比对的思想,对数据帧的格式信息进行推断。实验结果表明,通过以上方法,能从海量的比特流数据中实现对未知协议数据识别,对协议数据帧进行定界和切分。对于协议结构简单、长度较短的协议,能有效地对协议的域进行划分并对协议格式进行推断。