基于数据挖掘的自适应网络安全审计系统的研究与实现

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:HalfHour
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和网络技术的飞速发展,计算机网络带给人们的好处数不胜数,因此人民群众对信息网络的依赖性越来越强。但是有很多是敏感信息,甚至是国家机密将不可避免地吸引来自世界各地的各种攻击,如计算机病毒、数据篡改、数据删除和添加、信息泄漏和窃取等。针对这些层出不穷的安全威胁,迫切需要网络安全审计对上述问题进行有效监控和管理。在网络安全审计系统中,目前普遍采用的专家预先定义和数理统计的方法,这两种方法的问题会产生漏报和错报的现象,且不能检测新的异常行为。随着网络数据流量急剧增加和网络结构的日益复杂化,采用何种技术对审计数据进行全面、准确和高速地分析成了研究热点。鉴于此,本文提出了基于数据挖掘的自适应网络安全审计系统,所做主要工作如下:(1)本文首先详细阐述了国内外网络安全审计的现状、发展趋势,而且研究了几种数据挖掘方法在网络安全审计中的应用,并选择关联规则用于网络安全审计。针对单一最小支持度的弊端,深入研究了关联规则挖掘算法Apriori算法、多最小支持度算法MS-Apriori算法、最大值约束下的多最小支持度算法MSC-Apriori算法、基于图的频繁项集挖掘算法,比较这几种算法的优点和不足,从而为关联规则挖掘算法在网络安全审计中的特定应用指出了改进方向。(2)针对Apriori算法单支持度和需要N次扫描事务数据库的缺陷,本文在最大值约束下的多最小支持度算法MSC-Apriori算法和基于有向图的频繁项集挖掘算法的基础上,提出了基于有向图最大值约束下的多最小支持度的频繁项集挖掘的优化算法,采用了三种剪枝策略和深度优先遍历的方法,来生成频繁项集,只需要扫描数据库一次。这种优化算法能够在发现普通意义的频繁项集的基础上,进一步高效地发现有价值的稀有数据集,从而改善关联规则发现算法。将基于最大值控制下的多支持度MSC-Apriori算法与本文算法在相同的实验环境中进行了比较,本文算法在不同的数据集中所用时间要少,比MSC-Apriori算法效率要高;通过和单支持度Apriori算法的比较,本文算法在规则的有效率上也要比单一支持度的要高,而且能够发现有价值的稀有数据。(3)根据改进关联规则挖掘算法的核心思想,设计实现了自适应网络安全审计系统。其中自适应能力主要体现在两个方面:能检测出未知异常行为,并且能在大量数据下快速稳定运行。通过实验分析,该系统在这两个方面的优势明显的高于一般的审计方法,取得了较好的效果。
其他文献
大数据时代,互联网每天都会产生大量的数据,利用数据挖掘算法可以从中分析出有价值的数据。在聚类分析方法中,K-means聚类算法是应用最广泛的一种划分方法。该算法简单,且收
单核苷酸多态性(SingleNucleotidePolymorphism)是指在基因组水平上由单个核苷酸的变异引起的一种DNA序列多态性,它改变了基因原来的结构和连锁率,增加了个体的患病率。目前已有
移动对象是指空间位置或范围随着时间的变化而发生变化的事物。基于交通路网的移动对象索引技术广泛应用于城市交通中车辆与行人的位置记录、运动轨迹查询、时空查询、统计管
大规模地形场景真实感建模与绘制是虚拟战场、地理信息系统、三维游戏仿真等领域的基础。随着应用的不断扩展和深入,人们对地形场景的规模、绘制速度及仿真精度提出越来越高的
当前数据存储规模日益增长,单个存储设备和存储系统的容量及寿命有限,因此需要经常在不同存储设备和存储系统之间批量迁移文件数据集。不幸的是,现有方法通过单个文件串行拷贝的
随着计算机技术的普及和发展,计算机广泛应用于一些关系到国民经济和国家安全的关键领域,如金融、电信、银行、能源、军事等,对于应用于这些关键行业的计算机系统要求具有极
随着全球一体化的不断发展,学术研究不能闭门造车,需要与国外的学术界互相交流。但作为非英语为母语的英文学术论文写作者,经常会遇到一个英文句子该怎样表达才能让国外同行
近年来,随着金融、传感器网络、股票分析、气象监测等领域的不断发展,一种流动的无限的数据引起了数据库界的广泛关注,从而使数据流管理技术成为当前的研究热点。根据数据流
随着人们日益增长的个性化需求,通用搜索引擎显然已经不能满足用户的各方面需求,由于主题式搜索引擎具有效率高、专业化、目标化、准确性高、及时性、个性化等优势,能够得到越来
强化学习是一种重要的机器学习方法,其特点是通过感知环境状态信息来学习动态系统的最优策略,通过试错法不断与环境交互来改善自己的行为,并且对环境的先验知识要求很低。多Agen