云平台环境下实时日志管理系统的研究与实现

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:q520fang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在云计算平台中,各模块分步在不同的节点上,它们有些是物理服务器,有些是虚拟机,产生的日志数量规模巨大。众所周知,日志数据具有很大的价值。如果把云平台比喻成一个人的话,日志数据就像是我们去医院体检之后,体检单上那五花八门的条目,它们对我们的云平台给出诊断信息。然而,这些数据就像体检单上医生写下的结论,本身晦涩难懂,研发人员平时都经常忽视它们,更别说去挖掘它们的内在价值了。本文针对这种情况,提出并实现了一个具有故障预测功能的、并且可以把结果通过页面展示给用户的日志管理系统。本系统涵盖了日志采集模块、异步通信模块、日志处理模块、存储模块以及结果展示模块。其中最核心的两个模块分别为:基于flume改良的日志收集模块和具有预测功能的日志处理模块。日志收集模块是全套系统的根基所在,其汇聚了云平台上散落于各处的日志信息,为其他模块提供数据来源。针对日志收集模块在性能上的需要,本文做出了以下设计:(1)对通道进行了改进,使它可以根据数据流量的不同,灵活地选择内存通道或者是文件通道;(2)把hbase_sink分成三个级别,提供日志写入Hbase服务器的效率;(3)自定义了一个Sink,满足不同模块对Sink的需求。(4)根据实际运行环境,对参数进行调优。对日志处理模块进行设计的时候,本文就如何挖掘日志信息做了一系列的研究。首先,日志数据不同于网购类的数据,有着自己独特的地方。因此本文定义了若干个新的概念,同时研究和提出一种类Apriori的事件关联挖掘算法-Apriori-LTIS。为了提供系统处理的效率、节约资源,并进一步改进得到Apriori-simiLTIS算法。然后,提出了一个创新的概念ECG(event correlation graph)来表示事件相关性。最后,本文提出了一种基于ECG的故障事件预测算法,对云平台未来可能发生的故障做出检测。为了验证系统的完整性,本文对系统的性能和功能方面做了详尽的测试,并且用多组差异化的数据对提出的算法进行了实验,从平均分析时间、精确率以及召回率等指标对实验做出分析评价。文章最后提出系统设计的不理想之处,同时对将来的优化方向进行了阐述。
其他文献
GIS有两种普遍的应用需求:空间分析和数字制图,但两种需求对空间数据的要求不完全一致,导致空间数据在同一GIS中无法充分共享。该文探讨能够同时满足两种需求的GIS构建方法。
抢劫罪与敲诈勒索罪的界分问题一直是司法实践中的难点问题,传统刑法理论中往往以是否当场使用暴力、是否当场取得财物作为两罪的区分标准,即“两个当场”标准。随着理论研究
90年代后期英国重大疾病保险产品出现了恢复重大疾病保障条款。保险公司事先在保险单中列出一系列所谓的“特殊疾病”,如果被保险人身患保险合同规定的重大疾病获得保险金后,保
报纸
<正>作为80后的青年粤剧演员,我有幸见证了上世纪90年代到本世纪初期粤剧市场的繁荣景象,也亲身经历了当代经济飞速发展,人民的物质生活越来越丰富,而戏曲市场却越来越萧条,
期刊
应用聚合酶链式反应技术(PCR)扩增了拟南芥WRI1基因,并将其克隆到pMD18-Tvector载体上,对重组子进行PCR检测和限制性内切酶分析,并测定了该基因全序列。结果表明,该基因全长
目的探讨达克罗宁黏膜表面麻醉在内镜下结肠息肉切除术中的麻醉效果及安全性。方法选择拟行内镜下结肠息肉切除术患者128例,随机分为观察组66例、对照组62例。观察组在达克罗
随着生活水平的逐渐提高,人们的生活日益丰富起来,对生活的多样化的需求促进了科技多方面的发展,其中传感器作为生活中不可或缺的一部分,为多样化生活提供了极大的便利。传感
本文借鉴柔和燃烧技术中反应区弥散,温度均匀等优点,设计分析了柔和气化技术的可行性及其应用价值,并通过实验及数值模拟手段研究柔和气化技术的技术特性,模拟及实验设计验证
本文从历史的角度出发,从现代城市设计发展的历史根源、实践背景和科学理论基础3个方面,论证了现代城市设计发展的必然性和背景。