基于机器学习的Web安全检测方法研究

被引量 : 11次 | 上传用户:cy58452
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Web(万维网)应用的快速发展和其本身不受防火墙限制的优势,越来越多的传统的应用都转成了Web的应用形式。Web的普及,也带来了针对Web的攻击的爆发。入侵检测是防御攻击的主要手段,但传统的误用检测的将每一种攻击的特征手动编码成规则并逐一检测,难以应对快速增长的攻击类型,已经显露出明显的弊端;建立正常的行为模式,将偏离正常模式的行为视为攻击的异常检测研究思路逐渐显示出优势,也越来越受到重视。这种方法认为异常的攻击行为和正常的访问行为在行为模式上具有较大差异,正常的行为模式也较为固定和容易学习。这种方法常采用机器学习和数据挖掘中的模型和算法来建立正常行为模式的模型和检测方法,这种方法优点在于可以有效的应对新的未知攻击方式。本文据此思路,对基于机器学习的Web入侵检测进行了多方面的研究。本文提出了一种基于隐马尔科夫模型的语法检测模型。隐马尔科夫模型适合用于正则语法的描述,用隐马尔科夫模型表示的语法模型采用语法模型对样本的匹配程度作为区别正常和异常行为的度量标准,可以有效地学习正常的访问行为。算法结合贝叶斯最大后验概率的原则,给出了模型泛化的最优标准,使得语法模型不仅可以识别训练集中的样本,还可以识别与训练集中样本相似的其它正常样本。隐马尔科夫模型的语法检测模型具有很高的模型复杂度,导致学习和检测过程中也具有很高的计算复杂度。针对该问题,本文提出了一种以DFA(确定有限状态机)代替隐马尔科夫模型的检测方法。这种方法大大简化了语法结构,也简化了语法的学习、泛化过程。另外,包括隐马尔科夫模型在内的很多检测模型都需要额外的分类策略辅助完成对样本的最终检测,而DFA的结构既是语法描述结构,也是一个高效的分类器,可以独自完成检测分类,简化了检测机制。实验证明,这种模型不但可以简化学习检测过程,提高实用价值,同时能够很好的保持语法模型的检测性能。本文对基于语法的检测模型做了一个总结和比较。对主要的语法模型从系统复杂度、训练/检测特性、模型相互的内在联系等各个方面做了系统的分析,并在实验中给出了验证。本文基于异常访问样本只占总访问量一小部分的规律且正常样本具有较好聚类特性的特点,提出了一种基于聚类的无监督学习检测方法。这种方法免除了繁杂的训练样本的准备工作,直接在混有正常和异常样本的样本集合中通过聚类将样本集分为正常和异常的两类。算法还给出了基于最小误差原则的聚类停止标准。实验结果表明这种方法能达到很好的检测效果。由于异常的攻击类型、形式多样,层出不穷,单一种类的检测模型无法有效地检测实际中可能含有多种攻击类型的网络数据流。如何组合现有的多种检测模型对复杂的攻击数据进行更为有效的检测成了一个亟需解决的问题。本文针对该问题,提出了一种多模型融合的检测框架。本文方法将多个模型的异常估计值投影到统一的高维特征空间中,利用成熟的SVM分类器学习和分类样本。实验表明这样不仅可以提高检测性能,同时还能扩展可检测的攻击类型范围。
其他文献
变胞机构具有变结构和变功能特性。对满足变胞条件的运动链进行综合,是变胞机构结构学研究的难点。基于机构分析理论和变胞原理,对变胞机构的组成进行分析,定义变胞支链和变
现有两足机器人大体上可分为两足左右布置与两足上下布置两类,在步行过程中,两足交替支撑身体移动,使其承载能力十分有限。为了改善承载能力,提出一种基于2-UPU+2UU并联机构
教育信息化的发展和新课程改革的深入对教师的教学技能提出了许多新要求,然而现行的教学技能培养中,却存在"培养理念过分强调专业知识传授"、"课程设置不平衡且缺乏有效的整
随着国内经济持续、快速发展,人们对服务型企业的要求越来越高。因此,如何在日趋激烈的市场竞争中推出更具吸引力的服务已经成为这类企业占领市场、立于不败之地的关键。进入
<正>1养鸭业是我国的特色支柱产业之一我国的养鸭业具有悠久的历史。进入二十世纪八十年代,饲养量平均每年以5%~8%的速度递增。2004年我国肉鸭的出栏量超过24亿只,鸭肉产量约5
睢阳城是汉代梁国的都城,也是当时繁华的都会之一,睢阳城乃基于春秋宋国都城而建,自梁孝王迁睢阳扩建、研究睢阳城、城的设置和布局、历史沿革等,对于更好地研究梁国史以及汉史都
<正>社情民意和提案都是政协委员履职的重要载体,从报送过程和渠道来看,提案经审查立案到交办回复有一套严格的操作程序,时间跨度较长。而社情民意信息由政协有关领导签发后,
商丘种子植物区系组成计117科,506属,854种,其中裸子植物所占比例偏低;木本植物占商丘总种数的31.5%;区系地理成分复杂,归15个分布区类型,其中以温带成分为主,热带成分比较丰
本文首先介绍了种蛋的孵化条件主要包括:温度,湿度,空气,翻蛋,凉蛋。机器孵化设有自动控制装置,具有孵化效果好、易于操作管理和孵化量大等优点。而传统的孵化方法有桶孵法、缸孵法
根据齿面点旋转时的谐波运动轨迹,用旋转编码器构造出齿轮传动误差的单面啮合测量模型,并引申出计算齿轮传动误差的三种途径,即小轮当量的传动误差、大轮当量的传动误差以及