论文部分内容阅读
近些年来,云计算产业的飞速发展使得社会信息化程度得到了进一步提高,各个行业都开始在云服务上发力,为了不断满足人们对信息服务方面的需求,企业数据中心的规模也开始不断扩大,数据中心的设备数量和环境状况也变得越来越复杂,为了保证数据中心服务的可靠性,对数据中心的各个资源进行实时监控就显得尤为重要,但规模的不断扩大使得数据中心的资源种类和数量也越来越多,这使得监控任务变得越来越复杂,传统的监控方式逐渐难以满足现代数据中心不断扩大的规模。为了满足数据中心规模不断扩大所带来的监控需求,论文通过分析数据中心的资源特征和信息采集方法数设计了监控系统的基本架构,主要从数据传输和存储方面为监控系统提供横向扩展能力;为降低监控任务负载和监控数据体量,论文在数据采集方面设计了动态采集算法,通过数据采集周期自适应的方式来达到降低监控任务负载和提高监控灵活性的目的。论文通过对数据中心监控的相关技术和主流监控系统的详细调研,分析了现有监控系统的功能特点和不足,并在此基础上结合数据中心监控的具体需求提出了研究的两个方面,分别是降低监控任务负载和监控可扩展性研究。在降低监控任务负载方面设计了数据动态采集算法,动态采集算法能够根据监控数据的波动状态来预测数据出现异常的可能性,并由此动态调整监控数据的采集频率;监控可扩展性方面主要从监控数据的传输和存储方面进行研究,以分布式集群监控系统Ganglia为基础,分别采取分布式消息队列Kafka和NoSQL数据库MongoDB在数据传输和存储方面为监控系统提供横向扩展能力,并在此基础上增加了虚拟机信息采集接口,通过扩展SNMP的MIB来对不同虚拟化平台的公共监控指标进行了定义,并结合libvirt进一步实现虚拟机信息采集接口的统一。最后,论文对所设计的监控系统平台从功能和性能方面进行了测试,功能测试主要包括监控数据展示和不同虚拟机的统一信息采集测试,性能测试主要包括动态采集算法、消息队列吞吐率以及数据库的读写性能测试,测试结果表明所设计的监控系统能够提供更低的监控任务代价和更好的扩展性。