DFA压缩和Snort规则解析的算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:duzhiwei1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,针对网络传输的重要信息的攻击变得更加隐秘和复杂。从攻击数据包的头部到恶意代码、入侵指令等攻击可能隐藏在数据包的内容中。深包检测技术(DPI)不仅对数据包的头部进行检测,还对数据包的内容进行分析。DPI通过使用一组给定的安全规则与网络中捕获的数据包内容进行比较,从而发现数据包内容中携带的攻击特征。早期DPI定义的安全规则中,用精确字符串描述入侵行为的特征,这些字符串组成规则过滤集。然而,为躲避检测,各种恶意代码和入侵指令不断刻意隐藏自己的特征,导致精确字符串已经不能充分描述这些特征。正则表达式因表达能力灵活成为描述入侵行为特征的新一代工具。将正则表达式编译为确定性有穷自动机(DFA)可以实现正则表达式与数据包的匹配。DFA自身具有高效的匹配速率,但占用存储空间较大。如果用软件实现匹配算法,会面临匹配耗时过长的问题;如果用硬件实现匹配算法,则会面临存储空间较小的问题,通常硬件可用空间大小为数百KB到2MB左右。因此,构建时空高效的正则表达式匹配过滤算法是目前DPI研究的热点之一。本文重点研究了DFA的存储压缩问题,实验中所需的正则表达式来源于Snort2.8规则集中的一些关键选项。本文也简要介绍了实验中对Snort2.8规则集中关键选项的解析处理方法。主要工作为以下四个方面:(1)对于同一正则语言,可以存在多个识别此语言的DFA,但任何正则语言都有一个唯一的(不计同构)状态数目最少的DFA。将任意DFA转化为等价的状态数最少的DFA的算法称为DFA最小化算法。本文分析了DFA最小化算法实现的理论依据,描述并实现了一个DFA最小化的经典算法。(2)正则表达式在编译为DFA跳转表数据后,存在数据量大和数据冗余的问题。通过对DFA跳转函数表进行分析,发现了数据量大与其字符集和状态数之间的关系。分别提出了字符集压缩算法和基于层次聚类的状态压缩算法。(3)介绍了Snort2.8规则集中规则的构成,说明了从文本规则到存入内存数据结构的Snort2.8规则集解析处理过程,给出了一种抽取Snort规则中关键选项的算法。(4)通过Snort2.8规则集进行实验,评估了两种压缩算法结合使用后的DFA压缩效率。与原始DFA算法和D2FA相比,存储空间开销分别减少了98.7%和63.2%。
其他文献
随着人们对软件产品质量要求的不断提高,作为保障软件质量重要手段的软件测试技术逐渐被重视和应用。为提高软件测试的水平,实现软件测试的规范化,本文对软件测试进行了深入探讨
WebGIS是当前GIS应用领域的一个研究热点,其解决了传统桌面GIS应用的局限性,使GIS应用实现了真正的信息共享。WebGIS巨大的扩展空间以及跨越各种系统平台的能力,将使GIS的应用更
随着网络应用的普及与多元化,网络的安全问题逐渐被人们所重视。目前防火墙、入侵检测系统和防病毒软件已经成为广泛应用的安全防御解决方案,但是由于它们自身存在的一些不足,导
农业环境监测对于农业生产具有重要的意义。长期的农业环境监测收集了大量的数据,“被数据淹没,却饥饿于知识”的现象普遍出现了,迫切地需要找到一种技术来分析这些数据来为
首先,在分析了国内外视景仿真技术研究现状的基础上,概括性的介绍了有关的视景仿真基础理论,并对目前国内外视景仿真系统主要使用的主流视景仿真建模工具、高层渲染工具的优缺
随着我国变电站自动化水平不断提高,变电站地线的在线监测在电网安全运行中显示了重要作用。本文目的是利用无线局域网技术和嵌入式技术,研究开发基于WLAN的变电站地线监测系
工作流管理系统(Workflow Management System, WfMS)自出现以来,在一定程度上推动了企事业生产和管理的发展;而反过来,企事业生产和管理的发展又对工作流管理系统提出了更高
随着微电子集成技术和微计算机技术的飞速发展,现代数字存储示波器作为一种精密电测仪器得到了更快的发展,不仅其功能越来越强、精度越来越高,而且外形越来越美观。但现有的数字
GNU GCC编译器已经被广泛应用于CISC、RISC等各种处理平台,是一种支持多平台、多语言的、易于移植的编译系统。随着DSP技术的发展,特别是新一代DSP芯片的诞生,采用汇编语言对DSP
随着Web站点自身信息越来越丰富和拓扑结构越来越复杂,目前信息服务中普遍存在着“信息过载”和“资源迷向”的状况。从用户的角度,不同的用户有不同的访问目的,而同一个用户