论文部分内容阅读
云计算是近年来的热门话题,兴起了IT产业对服务使用方式的变革,越来越多的组织和个人使用云计算来部署自己的应用,开发自己的平台。云计算厂商的将更多的时间放在了虚拟化、负载均衡和存储上,但对于日志分析平台资源投入却很有限,因此相比原来的物理服务器部署,也带来了更多的安全隐患。本文在现有的研究工作的基础上,开展了云计算场景下的日志分析工作,主要研究内容如下:(1)提出一种基于事件滑动窗口的告警关联挖掘算法。云场景中部署了若干的物理主机和虚拟主机,每个节点收集到的告警日志汇集起来是海量的,因此如何从这些海量的告警日志中,提取关联的告警,并组成告警序列,画出攻击图重现攻击场景是首要的任务。将现有的序列模式挖掘算法应用到告警序列的挖掘中,不仅低效,而且会挖掘出很多的无意义的频繁序列模式,大大降低了正确率。因此,本文在其他现有告警关联的基础上,提出一种基于事件滑动窗口的告警关联挖掘算法,并利用MapReduce完成并行化,能够提高挖掘的速率,在海量日志的挖掘中性能优异,解决传统模式的不足。(2)提出一种基于访问流的属性关联DDoS攻击拦截模型。目前对云计算中主机的攻击,主要为DDoS攻击,由于节点众多,且攻击方式多变,需要一种有效的、动态的策略来增强防火墙抵御能力。现有的基于属性关联的置信度打分策略,通过对流量日志的分析,构建一种数据包打分策略,来过滤危险数据包。相比于原有的针对传输层和网络层的DDoS攻击,云计算场景中的应用层攻击在DDoS攻击中占有了很大一部分,因此原有的方法并不能很好拦截数据包。本文在现有工作的基础上,利用会话识别技术,提出了访问流策略,并在MapReduce上完成,能够解决现有方式的不足,提高对HTTP-DDoS的识别率。(3)针对多源异构的海量日志,设计并实现了统一日志收集与分析平台。此平台包括开发日志收集、日志实时分析、日志离线分析和模型构建等方案。将算法模型部署到系统后,都能达到预期的效果,具有较高的研究价值。