基于正则表达式的深度包压缩算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kkfhvk1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的深度包检测采用简单的字符串匹配技术将报文内容与一组固定字符串进行匹配,但是随着检测的内容日益繁杂,这种检测方法已不能很好的满足要求,而正则表达式能提供更强的表达能力和灵活性,因此基于正则表达式的深度包检测渐渐成为研究的核心。一个典型的模式集合往往包含上百个正则表达式,复杂的正则表达式用DFA(确定性有限自动机)存储,因为所需内存太大,从而使得时空复杂度较大,极大地降低了检测算法的效率。目前,如何提高基于正则表达式的深度包检测技术的效率,在国内外尚处于探索阶段。本文所进行的研究正是在该背景下展开的。本文首先分析当前IDS(入侵检测系统)存在的缺点,介绍CLAY系统(关联引擎的通用程序框架),介绍当前深度包技术的相关研究;然后在介绍数据包过滤技术和入侵检测技术的基础上,阐述深度包检测技术的工作原理。通过对常见模式匹配算法优缺点的分析,介绍正则表达式压缩并提出DFA拆分算法。正则表达式压缩是对于一些符合重写规则的正则表达式在转换成DFA之前,通过重写规则来改写正则表达式,使得DFA状态数由原来的平方或指数增长降低为线性增长。DFA拆分算法将DFA状态转换表拆分为间接索引表、转换输出表、直接转换表,使得DFA所占空间大大减少,从而高效率地实现了DFA的压缩存储,达到了理想效果。最后提出将正则表达式压缩和DFA拆分算法应用到CLAY系统中,用于检测网络中的深度包,有一定的实用价值。
其他文献
随着互联网技术的迅速发展,web信息爆炸性地增长,互联网已成为海量信息空间,搜索引擎解决了海量互联网资源的快速定位和检索问题,在网络时代发挥了巨大作用,成为人们在信息时代不
随着计算机技术和光电技术的发展,出现了一种新的检测技术--基于计算机视觉的测量技术,该技术是一种利用CCD摄像机作为图像传感器,综合运用图像处理技术进行非接触测量的方法,具
名词短语在句子中常常担任主语、宾语或定语等重要句法成分,其识别是自然语言处理领域的基础任务。汉语简单名词短语作为一种特殊类型的名词短语,兼具结构简单性和语义准确性
生物信息领域中,批量蛋白质同源性搜索和模体识别是当今的两个研究热点。本文针对批量蛋白质同源性搜索问题和模体识别问题,提出了基于聚类和压缩的批量蛋白质同源性搜索算法
随着生物信息技术的快速发展,海量基因组数据的涌现进入后基因组时代,研究者不再局限于研究单个基因的功能,而是希望以系统的角度理解维持生物生命活动的复杂生命过程,在这种
随着互联网技术的快速发展,移动互联网、智能硬件、大数据、云计算、人工智能以及020等新技术层出不穷,互联网技术已经应用到生活的各种场景中,极大地方便了人们的生活。在这
随着互联网的迅速普及,互联网已经成为一种新兴媒体,与传统的报纸、电视等信息传播媒介相比,网络上的信息传播时间短、突发性强、互动性好。尤其是互联网上发布的新闻信息更
随着网络的不断普及和发展,网络安全逐渐成为人们关注的焦点。其中特洛伊木马以其隐蔽性、破坏性、顽固性等特点已经成为网络安全的突出问题。木马的防御与检测也成为近年来
随着网络上信息资源的日益增多,搜索引擎的工作变得越来越困难。信息资源的无组织分布是导致搜索引擎工作不够理想的重要原因之一。本文的工作就是构建一个能使资源有组织聚合
我国历史悠久,文化遗产众多,其中文化遗存是重要的一部分。由于文化遗存是不可再生资源,并且遗存在发掘后也难于长久保存,在很多考古发掘项目中,往往由于考古人员的主观想法