论文部分内容阅读
当今,云计算在全球IT企业中被广泛研究和应用,各行各业的发展都越来越离不开云计算。云计算中最关键的突破是资源使用方式的改变,通过虚拟化的方式,可以快速的虚拟出一个独立的、随需配置的虚拟机供用户使用。实时的对虚拟机进行性能监控,准确的对虚拟机进行状态检测,以使在虚拟机出现重大故障之前做到预防和处理,这是目前急需研究的重要问题。为了解决这个关键问题,本文提出了基于运行环境的检测域划分的异常检测策略和Canopy-Kmeans异常检测算法,并设计了云平台中的虚拟机异常检测系统框架。本文的主要研究工作和创新点如下:(1)对云平台的基础架构,特别是面向基础设施的云平台进行深入研究。同时针对当前云平台自身的各种特点,设计了一种基于虚拟机运行环境属性的检测域划分策略,并以此提出了云平台中的虚拟机异常检测框架。对云平台的稳定运行提供了可靠保证。(2)深入研究开源云平台OpenStack的系统结构,并采用其搭建云平台实验环境。以OpenStack作为主要云平台研究对象,根据其特点提出了虚拟机运行状态信息指标体系,分为虚拟机运行环境指标和虚拟机性能指标两类。同时以OpenStack的libvirt虚拟化库作为虚拟化研究对象,设计并实现了云平台中虚拟机异常检测系统的数据采集模块。根据云平台的自身结构和采集模块的特点,提出了自适应的采集策略。(3)通过研究异常检测技术,主要是异常类型和数据异常分析的方法,提出了针对云平台下虚拟机异常的异常检测方法。首先利用基于运行环境的检测域划分策略对所有虚拟机进行分类。通过使用Canopy算法对运行环境指标集数据进行粗聚类。然后在划分的检测域中,使用主成分分析法降低性能指标集数据的维度。最后使用本文提出的Canopy-Kmeans算法对降维后的数据进行异常检测,检测出处于异常状态的虚拟机。(4)通过异常注入的方式模拟真实的云平台环境进行实验验证,实验结果验证了本文的虚拟机异常检测系统异常检测中的准确性。