基于非平衡数据分类方法的网站入侵检测

来源 :山西大学 | 被引量 : 0次 | 上传用户:zhui130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网站在日常办公中的日益普及,一方面给我们的生活带来了便捷,另一方面也需要我们预防形形色色的网站入侵行为。而IIS网站日志记录着访客的每一次访问行为,其中就隐藏着非法入侵行为的蛛丝马迹。通过日志分析可疑行为已成为网站入侵检测的一个重要环节。目前研究人员已将数据挖掘技术运用其中,取得了不少进展。从网站日常的访问情况来看,正常访问量明显多于非法访问量,为典型的非平衡数据集。如何通过分类算法,将占少数的非法访问记录从海量记录中分离出来成为关键。因此,利用非平衡数据分类方法对网站日志进行分析,发现网站运行中的非法入侵者,并对新的访问者身份进行分类预测,对于提升网站的安全性能,优化网络环境,保障网站的正常使用具有重要的意义。本论文将非平衡数据分类方法应用于入侵检测中,日志记录被分为两类(非法访问记录,正常访问记录),通过对不同分类方法和检测效果的比较分析,设计并实现了基于IIS(Internet Information Server)日志的入侵检测系统。本文主要工作如下:(1)根据IIS日志特点和入侵关键字,利用数据库技术完成数据属性选择,本文将8种采样算法(随机欠采样、SOMTE、Tomek links、K-Means、OSS、SOMTE+Tomek links、SOMTE+K-Means、SOMTE+OSS)和3种分类方法(C4.5、3-NN、Naive Bayes)组合形成各种分类模型,并在UCI、KDDCup99和IIS日志等数据集上进行了实验和比较分析。(2)设计并实现了基于IIS日志的入侵检测系统,本系统分为四个功能模块:数据采集层,数据处理层,数据分析层,数据预测层。将采集到的日志数据预处理形成需要的格式和属性;通过组合系统中的采样和分类算法,分析其分类效果,选择最优的分类方案对日志数据进行预测。
其他文献
能源始终伴随着人们的生活,随着工业化程度的提高,人们对能源的需求越来越大,但是地球上的化石能源是有限的,并且正在日益枯竭,人类面临着严峻的能源问题。因此,开发可再生能
污染物排放监测数据的准确有效性是污染治理的首要前提,而在实际监控过程中由于系统及人为原因导致了污染物排放数据中带有大量的异常数据。本文研究介绍污染物排放监测系统,
卷积神经网络将目前很热门的深度学习技术、人工神经网络方法相融合,形成一种新型的人工神经网络模型。它被广泛地应用在图像识别领域,其优点是让应用系统具有更清晰的层次化
蜻蜓凤梨(Aechmea fasciata)隶属凤梨科,为多年生草本单子叶植物,具有非常高的观赏价值,深受人们的喜爱。但是由于其营养生长期较长,所以人们一直通过控制栽培环境的温度、光照
湿式双离合器作为现代智能汽车的重要组成部分,其特点是在不中断动力输出的情况下实现档位切换,对现代汽车工业发展影响至深,现已成为各大汽车厂商关注的焦点。在湿式双离合
多花水仙(Narcissus tazetta Linn.)是石蒜科大家族中的重要一员,属于单子叶球茎类花卉,是我国传统十大名花之一,具有很高的观赏价值和一定的药用价值,主要产自福建、上海、
南朝梁代僧人寶唱撰集的佛教類書《經律異相》,幾乎囊括了公元6世紀之前傳入我國的漢譯佛經,其中就包括了《賢愚經》。但它並沒有直接照抄,而是進行了重新的編纂與整理,這就導致了大量異文的産生。目前對於佛經異文的研究多是集中在字詞方面,句用和語篇方面的研究還比較少,爲此論文以《經律異相》所引《賢愚經》與其原經的異文爲研究對象,從字詞、句用、語篇等三個角度來展開論述。在語料庫建設的基礎上,通過對比分析異文,
随着生态环境变差和自然灾害的增加,对人类社会经济和生活带来的影响与日俱增。同时传统化石能源的消耗也在迫使人们寻找更多替代的清洁能源,新能源的研究与应用成为了愈加热门的话题。中国北方严寒地区的冬季采暖对能源的消耗巨大,所以寻求清洁采暖迫在眉睫。人们对太阳能的利用持续了几千年,它清洁且容易获得,近几年在建筑节能领域对太阳能的应用不断增加。其中太阳能集热器是光热收集与转化的核心部件。为了提高太阳能集热器
目的:分析脑卒中后延髓麻痹所致吞咽困难的临床特点,观察肌电引导下人迎穴穴位注射治疗脑卒中后延髓麻痹所致吞咽困难的治疗效果,证明肌电引导下人迎穴穴位注射对于治疗脑卒
光合碳是“大气-植物-土壤”系统碳固定的起点,也是土壤有机碳的重要来源。地膜覆盖(简称“覆膜”)与施肥在提高作物产量同时,也显著影响了光合碳在土壤中的固定与转运。由于过