基于机器学习的异常流量检测系统研究

被引量 : 3次 | 上传用户:woai2010ni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,网络安全问题日益突出,异常流量检测这一领域也受到了广大科研工作者的关注。现有研究成果非常多,诸如利用自相似法、数据挖掘理论、统计模型等方法进行了这方面的研究工作。本文也是针对异常流量检测这一点进行深入研究。支持向量机是上世纪九十年代提出的一种基于统计学习理论的算法。它是基于结构风险最小化、VC维理论提出的,能够处理小样本数据,具有泛化能力好等优点,广泛应用于模式识别、回归估计等各个领域。本文也是利用支持向量机来解决异常流量检测这一问题。本文设计了基于CIDF通用框架的基于支持向量机的网络异常流量检测系统,将支持向量机用于系统的核心——事件分析器,分析了其可行性和构造多类别支持向量机的构造方法,还详细阐述了各个组件的功能和数据交互流程。异常流量的数据本身数据维数较高,使用基于信息熵的特征选择算法,提取重要特征和去除冗余特征,降低了维度。通过对比实验,验证了算法的正确性,在检测精度几乎不变的前提下,大幅缩短了训练和检测时间。核函数及其参数的选择始终是支持向量机的核心的问题,本文通过对比实验发现RBF核函数更适合于异常流量检测问题,并理论分析了BRF函数的优势。本文还围绕核函数的基本性质和如何构造进行了详尽的说明。在此基础上,通过一个新的带权值的距离公式替换原有的RBF核函数中的表示距离的部分,构造出一个新的核函数。改进的RBF核函数考虑了到异常流量的数据集是异构数据集这一特点,将数值的差异标准化,更利于机器学习,并考虑了各个特征属性对类别的贡献度,通过模糊函数的隶属度来达到不同特征的权值不同这一目的。从理论上说,改进的RBF函数合理的解决了异构数据集的数值差异化,提高了检测精度。
其他文献
光伏组件是太阳能发电系统中的关键部件。随着光伏产业的飞速发展,我国已经成为全球光伏产量第一的生产国。光伏组件产量巨大,这要求设计与之相符合的运输包装。然而,目前光伏组
本文首先介绍了布迪厄的社会学理论,社会学的主要任务是揭示构成社会宇宙的各种不同的社会世界中那些掩藏最深的结构,同时揭示了那些确保这些结构得以再生产或转化的机制,其主要
随着云计算技术的迅速发展,传统的计算模式正逐步被按需使用、易于伸缩扩展的云计算模式所取代。云计算技术的产生,特别是IaaS技术的广泛运用,大大降低了构建基础架构的费用,
美国烟草控制运动中产业去正常化的历史经历表明,产业去正常化策略的实施会给烟草产业及相关组织带来组织污名,其根源来自对烟草产品这一产业核心特征所形成的价值观冲突,这
上世纪90年代以来,随着房地产市场的迅猛发展和民众对住房的需求日益增强,房屋租赁市场不断壮大,在国民经济增长和社会管理中都发挥了重要作用,但也存在诸多问题。本文以广州
生物学概念既是构成生物学知识的基本单位,也是组成生物科学素养的重要内容。因此,生物学教学必须重视概念教学,关注学生生物学概念的形成、建立和发展。广大生物教师历来也
心理管理作为一种作用于人的科学化管理方式,必须将其纳入军校研究生学员管理之中,以提升管理层次和水平。本文在总结归纳当前军校学员心理管理类型的基础上,着重分析了军校
目的:通过回顾性分析,比较GRACE与TIMI评分系统对ACS患者住院期间发生心脏性死亡的预测价值。方法:查阅2008年1月至2012年12月广西医科大学第一附属医院急性冠脉综合征(Acute C
<正> 利用各种价差获利的一种技术。即在一个市场上购买货币、证券或商品的同时在另一个市场上高价出售。套汇(套利等)活动使世界不同市场上的价格差别不断缩小,直至最小程度
目的:探讨针刺对复发性流产患者甲状腺自身抗体异常时的治疗。通过讨论甲状腺自身抗体异常对复发性流产的作用机理、针刺治疗的理论依据,针药并用对本病进行治疗。减轻患者临