基于模拟退火算法的正则表达式分组研究

来源 :深圳大学 | 被引量 : 2次 | 上传用户：xuwei800

【摘要】

：

传统深度包检测技术通过精确字符串对病毒进行描述,这种方法效率很低,已经无法适用于流量极大的互联网数据流。正则表达式具有简单、高效、表达能力强的特点,特别适合应用于

【作者】

：

毛志强

【出处】

：

深圳大学

【发表日期】

：

2019年01期

【关键词】

：

正则表达式深度包检测模拟退火算法分组算法遗传模拟退火算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统深度包检测技术通过精确字符串对病毒进行描述,这种方法效率很低,已经无法适用于流量极大的互联网数据流。正则表达式具有简单、高效、表达能力强的特点,特别适合应用于深度包检测中。在实际使用中可以将多条正则表达式合并生成一个DF A引擎,实现一次匹配多条正则表达式的目的,提高匹配效率。但是当多条正则表达式解析为一个DFA引擎时,存在“状态爆炸”的问题。理论上,在最糟糕的情况下,这种现象会使DFA状态数呈指数增长,导致普通硬件平台无法生成DFA。研究表明,对正则表达式进行合理的分组是解决该问题的一个有效方法,所以将能引起“状态爆炸”的正则表达式分到不同组,将没有引起“状态爆炸”的正则表达式分到相同组可以有效避免该问题。分组的目标是在尽可能短的时间内得到各组DFA总状态数最少、分组数最少、各组状态数标准差最小的结果。然而,现有的分组算法存在分组时间过长、各组状态数标准差偏大、DFA状态数偏大的问题,分组结果并不理想。研究发现,目前大多数正则表达式分组算法需要不断生成DFA引擎以判断是否发生了“状态爆炸”,这个过程导致了算法的分组时间较长。在第2章中,为了提高分组效率,本文改进了已有的正则表达式DFA状态数预估公式并且提出了基于正则表达式预估膨胀率的分组算法(GRE-EER),该算法根据预估公式求得正则表达式间的预估膨胀率并且用其来指导分组,不需生成DFA引擎,可以较大地提高分组效率并且得到初步的分组结果;为了得到准确的分组结果,提出基于正则表达式真实膨胀率的分组算法(G RE-RER)。GRE-RER根据正则表达式间的真实膨胀率来指导分组,可以得到准确的分组结果;为了尽可能减小DFA存储空间,加入局部优化算法。在实际使用中,为了高效率地得到分组结果,将GRE-EER、GRE-RER与局部优化算法相互结合,提出GREEER-RER策略。为了使算法具有全局搜索能力,本文在第3章中将模拟退火算法和GRE-EER-RER相结合,提出基于模拟退火算法的正则表达式分组算法(GRE-SAA)。在该算法中模拟退火算法负责在全局范围内搜索最优解,不断生成新解使用GRE-EER进行分组,其分组结果满足一定条件再对该解使用GRE-RER进行分组。为使GRE-SAA适用于大规模规则集,对其进行了改进,提出了适用于大规模规则集的GRE-SAA算法。实验结果表明,GRE-SAA对小规模、中等规模和大规模规则集均有很好的分组能力,在DFA状态总数、各组状态数标准差以及分组时间等方面均优于其他全局搜索算法。为进一步提高算法的收敛能力和搜索能力,本文将模拟退火算法、遗传算法和GR E-EER-RER相结合,提出基于遗传模拟退火算法的正则表达式分组算法(GRE-GASA)。设计实验将其与GRE-SAA进行对比分析。实验结果表明,对于小规模和中等规模规则集,该算法收敛能力以及分组结果优于GRE-SAA,但是分组效率不及GRE-SAA。故在对分组效率要求不高的情况下,建议使用GRE-GASA,否则建议使用GRE-SAA。最后为使GRE-GASA适用于大规模规则集,对其进行改进并且设计实验与其他算法进行对比分析。实验结果表明对于大规模规则集,GRE-GASA与GRE-SAA的分组结果差不多,均优于Becchi算法。

其他文献

降解半乳甘露聚糖体外酵解特征及其对肠道菌群影响研究

野皂荚胶和瓜尔胶都是富含半乳甘露聚糖的豆科植物的种子胶,在许多工业应用中被广泛用作增稠剂和稳定剂。探究种子多糖胶降解后的体外酵解行为,对于拓展其在食品加工中功能特

学位

体外酵解野皂荚胶瓜尔胶短链脂肪酸菌群组成部分降解

麦红吸浆虫SmHSP23基因的克隆及其在滞育与温度胁迫下的表达

小热休克蛋白(Small heat shock proteins,sHSPs)不仅与环境胁迫而且与昆虫滞育密切相关。麦红吸浆虫Sitodiplosis mosellana(Géhin)属双翅目瘿蚊科,是一种典型的专性滞育昆

学位

麦红吸浆虫热休克蛋白23基因(HSP23)滞育低温胁迫基因表达

采动影响下任楼煤矿突水水源判别及水文地球化学特征演化分析

为了揭示采动影响下煤矿区主要充水含水层水文地球化学特征时空演化规律。本文以淮北煤田任楼煤矿为研究示范,收集矿井不同时期新生界松散层第四含水层、二叠系主采煤层顶底

学位

水文地球化学演化特征主成分分析水源判别

可调谐太赫兹超材料吸收体的研究

超材料吸收体是一种能够通过合理的设计结构尺寸达到完美吸收的人工复合材料。在太赫兹频段,超材料吸收体在传感、隐身和探测等领域有重要的应用前景。目前大多数超材料吸收

学位

超材料吸收体可调谐二氧化钒石墨烯

控股股东股权质押与中小投资者保护

随着股权质押由场外逐渐转向场内,我国资本市场的股权质押规模迅速膨胀,甚至呈现“无股不押”的局面,这对资本市场的各个参与者都产生了深远影响。股权质押缓解资金紧张的同时,也会给各利益相关者带来风险,尤其是近来在资本市场上“频频爆雷”,中小投资者的经济利益严重受损。控股股东股权质押源于股东自身的融资约束,但这种融资方式加重了代理冲突,使第二类代理问题在企业中更突出更严重,尤其在股权质押爆仓、控股股东被动

学位

股权质押投资者保护资金投向

稀释剂对刨花板和中纤板漆饰涂膜苯系物释放的影响

漆饰刨花板和中纤板家具在现代家装中被大量使用,油漆稀释剂的使用成为室内苯系物的直接来源。为研究稀释剂种类对漆饰板材苯系物释放的影响,减少室内苯系物污染和对人体健康

学位

PU漆饰刨花板NC漆饰中纤板苯系物漆膜性能健康风险评价

基于建筑使用寿命的拆除废弃物估算方法及管理对策研究

深圳市大规模的城市更新改造活动,特别是拆除重建过程中产生了大量的拆除废弃物。目前建筑拆除废弃物资源利用效率和水平均较低,而以堆填为主的粗放处理处置模式不仅侵占了宝

学位

拆除废弃物建筑使用寿命产废率产生量管理对策

聚（10-羟基癸酸酯）及其交联膜的合成与性能

近些年来,随着石油资源的日益匮乏和环境污染的日益严重,人们开始寻找可以代替传统石油基聚合物的新型聚合物。生物基聚合物具有可持续性、环境友好、生物相容等诸多优点,因

学位

生物基聚酯10-羟基癸酸分子量形状记忆性能

一事一议财政奖补对我国农村公共物品供给的影响研究

2008年2月,为了提高村民和村干部集资办事的积极性,拓宽资金来源渠道,中央政府颁发《关于开展村级公益事业建设一事一议财政奖补试点工作的通知》,在村民筹资筹劳的基础上按比例对公共项目进行补助和奖励,形成“民办公助”的供给模式。“一事一议,筹资筹劳”逐渐演变成了“一事一议,财政奖补”。到2011年,一事一议财政奖补制度已经推广至全国,成为我国农村地区公共物品供给的主要模式。合理地评估一事一议财政奖补

学位

一事一议财政奖补公共物品

特长油气田高瓦斯隧道灾害源精准预测与瓦斯控制研究

随着我国西南地区城际铁路与公路的快速发展,涌现了大量的穿山隧道工程,在此区域修建的隧道不得不穿越油气田区域。油气田瓦斯隧道不同于煤系瓦斯隧道,安全风险比较高,施工控

学位

油气田瓦斯隧道瓦斯分级灾害精准预测瓦斯控制

基于模拟退火算法的正则表达式分组研究

其他学术论文