论文部分内容阅读
在新的网络时代,人们的日常生活、工作都离不开互联网的应用。互联网信息呈现着多样化,所承载的应用也纷繁复杂。因此,对互联网数据的实时检测和还原具有十分重要的意义。课题研究HTTP协议展开的。主要完成对网络中HTTP应用数据的采集和还原,并综合性分析HTTP应用的多样性。针对目前常见的网络应用完成了以下工作。首先对课题研究的背景及其意义进行了阐述,同时介绍了研究中涉及的理论和技术背景,包括TCP/IP协议、WinPcap开源项目、HTTP协议、字符编码技术和模式匹配技术。然后从协议分析角度研究了HTTP应用的多样性,就其典型业务微博、论坛、搜索引擎和网页邮件在流量特征定义、流量快速识别和数据还原等方面进行了全面论述。其次,论文在对HTTP协议及其技术背景介绍的基础上,设计和实现了HTTP应用数据实时检测和还原系统。系统包括三个模块,数据采集模块实现对HTTP流量数据的实时采集;数据处理模块实现对HTTP流量数据的快速识别;数据还原模块实现对HTTP流量数据的还原。最后,基于系统设计过程中涉及的问题结合相关理论和技术提出了解决方案。为了实现流量的快速识别,采用合理的模式匹配算法对系统进行了优化。在分析各类模式匹配算法的基础上,系统使用了WM多模式匹配算法完成对HTTP应用数据的识别。在HTTP流量数据背景下,对单模式匹配算法BMH提出了改进思路,并设计和搭建测试环境,对系统整体性能在优化前后进行了测试分析。测试结果很好的验证了优化后系统性能有了一定的改善。