随机森林在云环境异常检测中的应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:li132zhihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来云计算不断发展,针对虚拟主机的入侵也越来越多,传统的网络安全措施难以适应云环境安全检测需求。为了解决云环境下的网络安全问题,研究者们提出了基于机器学习的云环境异常检测技术。在机器学习算法中,BP神经网络、K-Means、SVM等算法被广泛应用于异常检测,但是这些算法复杂度高,模型泛化能力弱,数据量较大时检测时间较长。随机森林是集成学习Bagging思想的典型应用,每个弱学习器给出一个分类结果,然后将多个弱学习器并行组合成一个强的学习器,最后投票决定最终分类结果,该方法简单且准确率高。本文通过对异常检测以及随机森林的研究,设计了一种使用随机森林进行异常检测的系统,采集Windows审计日志作为数据训练模型,并对异常检测结果使用准确率、精确率、召回率、F-1度量进行了评估。论文主要工作内容如下:(1)针对数据处理,论文先对数据进行预处理,在充分挖掘数据含义的前提下,使用随机森林特征重要性这一度量标准,在多维时间序列日志中找到对分类结果起关键作用的字段,对这些字段进行特征编码,从而将多维时间序列转化成由0和1组成的特征向量,并以此作为随机森林算法的输入数据,进行异常检测,大大降低了模型计算复杂度,结果表明训练数据量为40万时,模型训练检测时间约为5s,达到了实时检测的要求。(2)针对随机森林模型,设计了云环境下的随机森林异常检测系统,利用机器学习Sklearn库对样本数据进行训练,通过调整随机森林中决策树个数、每个决策树节点分裂时参与判断的特征数目、决策树最大深度等重要参数,确定了理想参数范围,并在测试集上取得了很高的分类准确率。(3)作为横向对比,采用相同数据集,在随机森林检测基础上,分别使用AdaBoost、SVM、K-means算法进行了异常检测。在训练时间以及准确率等方面,将结果与随机森林算法进行对比,对模型进行评估及优化。其中在训练检测所花时间方面(样本数据集为40万),随机森林算法花5s左右,AdaBoost算法花50s左右,SVM花3小时左右;在准确率方面,随机森林也高于SVM、AdaBoost和 K-means算法。
其他文献
磷酸盐玻璃具有许多优势特点,例如较低的熔制温度、透紫外光线、色散力低等,其在激光材料、缓释材料、核废物材料的固化和其他方面具有潜在的应用价值。但磷酸盐玻璃自身缺点在于其热性能和力学性能较差,这是由于其结构单元[PO_4]四面体中含有的P=O双键导致磷酸盐玻璃呈层状或链状结构,这种特殊的结构限制了它的应用。故此本文以磷酸盐玻璃材料为研究对象,采用传统高温熔融方法制备了六组体系的磷酸盐玻璃材料,研究了
目的:通过对动脉粥样硬化患者的中医体质类型以及分布规律进行回顾性研究,探讨动脉粥样硬化患者的中医偏颇体质分布规律。分析动脉粥样硬化的相关指标以及影响因素和血瘀体质的相关性,并进行扶正化瘀膏方干预血瘀体质颈动脉粥样硬化患者的临床疗效观察研究,以期探索出以辨体治病为依据的治疗动脉粥样硬化的中医治疗方法。方法:收集曙光医院治未病中心近两年的动脉粥样硬化患者的临床病例资料以及中医体质辨识结果,采用回顾性研
强流脉冲电子束(HCPEB)表面改性处理是近二十多年发展起来的一种表面改性技术,已有研究表明该技术对金属材料的表面耐磨性能和耐蚀性能有着明显的提升。本文选择两种镁合金Mg-4
近年来,随着中国经济的多元化发展和国家鼓励中小企业发展战略的实施,小企业之间的合作现象日益增多,小企业间以社会网络达成商业合作链接,形成了新型的合作伙伴关系。在学术界,越来越多的学者开始关注旅游小企业社会网络对企业绩效的影响。他们越来越重视在旅游小企业研究中社会网络和关系嵌入的应用,并取得了令人瞩目的研究进展。然而,以往研究较少考察到旅游小企业的社会网络对企业绩效产生影响的具体作用机制。本研究以社
随着现代工业的发展,水中铬离子(Ⅲ)的污染也越来越严重。大量的铬离子(Ⅲ)不仅对生态环境造成了危害,而且威胁着人类的健康,铬离子(Ⅲ)的污染越来越受到人们的重视。吸附法是常用的处理水中铬离子(Ⅲ)污染的方法。SBA-15分子筛,因其比表面积大,拥有高度有序的孔道,良好的水热稳定性和化学稳定性,且孔径大小可调,是吸附水中铬离子(Ⅲ)的理想吸附剂。但是纯硅系的SBA-15分子筛缺少活性基团,对水中铬离
问题导学课堂模式是以问题为主线,学生为主体,提倡在教学中发挥教师在课堂中的引导作用的教育模式。与传统教学模式不同,问题导学模式倡导“以学生的学”来制定“老师的教”。多年以来,在实践中较为成功的实施此模式的有“杜郎口”中学、“洋思”中学等。2011年开始,图们市开始教学改革之路,将问题导学模式推广到中小学义务教育阶段,经过多年的实践与研究,问题导学模式渐渐地融入到图们市的教育教学当中,在教师的不断努
随着信息时代的到来,为保护芯片中的信息安全以及防止芯片自身所携带的高新技术不被他人再利用或再研发,可自毁电子器件已经成为了研究的热点。本论文设计了一种基于MEMS工艺的自毁器件,采用机电触发、化学腐蚀的方式实现硅基微结构的完全自毁。分别对自毁器件中的MEMS隔离膜、MEMS冲击锤、静电驱动结构和静电锁止结构进行理论分析和结构优化,并设计了加工工艺流程和版图。本论文的主要研究内容如下:对MEMS隔离
精确制导武器在现代战争中发挥着重要的作用。而红外制导一直以来都是精确制导武器的主要制导方式之一。目标检测算法则是红外制导系统中的关键环节。随着军事科技的日益进步,深度学习与红外目标检测算法的结合已经成为下一代人工智能武器的重要研究方向。数据是深度学习的重要基础,任何深度学习算法都离不开数据。数据集的数量和质量将直接影响到深度学习算法的性能。然而由于军事目标的敏感性,很难获得足够数量的公开数据集对军
为了解决由于人口老龄化、交通事故等原因造成的失能人士护理问题,设计和研发能够提供康复护理和生理状况监测功能的医疗设备显得尤为重要。生命体征参数的实时测量能够及时
超声振动钻削是一种新兴的复合微孔加工方法,它将普通钻削的旋转运动与超声振动两种运动相结合,使得切削用量产生规律性的周期性改变,实现了钻头脉冲式断续切削加工,从本质上