基于数据增强的网络异常流量检测方法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:hlpaccp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络空间结构及其应用日趋复杂,网络攻击技术也日新月异。为了躲避网络流量异常检测,攻击者往往利用混淆、加密等方法加强隐蔽,因此网络流量异常检测往往面临速度慢、准确率低、误报率高、泛化能力弱等技术挑战。本文提出基于数据增强的网络异常流量检测新方法,能够从训练数据集中提取关键词,同时基于关键词回避策略对训练数据集进行数据增强,最终提高针对网络异常流量检测的机器学习模型的跨数据集检测能力。基于本文方法设计了基于文本分类的全监督学习模型与基于UDA的半监督学习模型,这两种方法都可以从海量的HTTP流量中区分出异常流量与正常流量,并且拥有较高的泛化能力。实验结果表明,本文方法仅通过小型训练数据集即可提高机器学习模型的检测能力,同时相较于其他方法,在显著降低计算复杂度的同时拥有更优的跨数据检测能力。并且在使用较大训练集时,半监督检测模型检测能力更优于全监督检测模型。
  本文的主要工作如下:
  (1)提出了一种基于关键词库回避的数据增强方法。对已标记的HTTP流量,根据特殊字符进行自动分割,提取并建立关键词库。基于关键词库回避,通过对原始训练集的非关键词字符数据进行随机替换的方式增强数据集,并且通过实验得出数据增强最优参数。
  (2)提出了一种基于文本分类模型的全监督检测模型。该方法利用关键词库回避的数据增强方法对训练数据集扩增,通过Word2vec实现将训练数据集语句转为向量的语句,应用全监督机器学习模型实现对HTTP流量的异常检测。
  (3)提出了一种基于UDA的半监督检测模型。该方法利用关键词库回避的数据增强方法对训练数据集扩增,通过UDA算法使用少量标记数据来预测未标记的扩增数据,应用半监督机器学习模型实现对HTTP流量的异常检测。
其他文献
化学是一门以实验为基础的学科。在进行线上教学时,播放实验操作视频往往成为教师的首选。这样做虽然在一定程度上能使学生学习到实验知识,但仍存在学生对实验过程印象不深刻、对基本实验操作不熟悉等问题。基于“翻转课堂”的家庭趣味实验正好弥补了这个缺陷,使在家里做化学实验成为现实。  一、课前准备:完成信息吸纳  学生做好课前准备是“翻转课堂”的关键环节,是学习目标有效达成的基础。为了更好地开展课内实验,学生
期刊
随着机器学习、深度学习等人工智能技术的发展以及数据分析、数据挖掘等专业的兴起,对于真实有效数据的需求越来越迫切。而在医学领域,尤其对病人的电子病历的需求尤为突出。电子病历不仅真实记录了病人的症状和医生开出的处方,但是也同时记录了病人的隐私。这样在数据的共享中就会出现数据的泄露、篡改、挪用等风险。在传统的数据分享模型中都需要一个数据的第三方作为中介。这种模式,不仅增加了数据的分享的成本,而且由于第三管理不到位其中某些工作人员因一己之私,窃取并贩卖数据同样也会给数据造成分享风险。随着技术的发展,区块链技术的出
武汉市第三中学(下文简称“武汉三中”)前身为始建于1705年的汉阳府晴川书院,1905年改制为汉阳府中学堂,抗战胜利后更名为湖北省立汉阳高级中学,1953年定名为武汉市第三中学。学校拥有现代化的实验室、“智慧校园”管理系统、心理咨询室和创客空间,现有32个教学班,在校学生1700余名,专任教师180余名,其中湖北省特级教师5人,市区名师、省市劳动模范、市区学科带头人、骨干教师120余人。  学校全
期刊
学校印象  武汉市江夏区义贞小学位于武汉市江夏区金口街淮山村凤凰山路与武赤线交汇处,原名金口淮山小学,1970年建校。为纪念金口籍革命烈士唐义贞,1998年学校更名为义贞小学。  学校现有教学班17个,学生644名,教师54名,其中湖北省特级教师1名,市学科带头人2名,区学科带头人1名。学校始终秉承“继承革命传统,以温馨的文化育人;尊重科学规律,以合适的方法教书”的辦学理念,深度挖掘红色教育资源,
期刊
引领、保障和推动党的教育方针全面贯彻到学校工作各方面是中小学校党建的根本任务。发挥中小学党建作用,需要研究推进中小学党建工作的方法与策略。打造“看得见”的党建,就是要研究中小学党建抓什么、怎么抓的问题,破解中小学校党建与各项工作的融合难题。“看得见”的党建是让广大教职员工在业务中有感知、环境里有感触、生活上有感受、内心里有感动的党建。  在学校文化中看到党建的厚度。党建就是做“人”的工作,制度管人
期刊
长江滚滚,汉水悠悠;山川秀丽,文风称盛。经受天地灵气的润泽化育,在先贤精神的熏陶滋养下,武汉三中走过了筚路蓝缕、励精图治、蓬勃发展、再创辉煌的奋斗征程。学校以习近平新时代中国特色社会主义思想为指导,坚持“文化立校、内涵发展”,以改革的思路、创新的思维,推进学校高质量、深层次的发展,努力为国家培养更多具有科学家精神的青年人才。2021年,学校开展了“学党史、感党恩、跟党走”红色教育主题活动,邀请党校
期刊
[摘 要]社会治理是国家治理的重要内容。加强和创新基层社会治理,构建基层社会治理新格局,需要发挥民主党派基层组织的作用。本文以民盟三峡大学附属仁和医院支部与伍家岗区伍家乡鑫鼎社区联动开展的共驻共建活动为例,探讨民主党派基层组织在社会治理中发挥作用的路径。  [关键词]民主党派 基层组织 社会治理  [中图分类号]D665 [文献标识码]A [文章编号]1671-2803(2020)06-0020-
期刊
摘要:以学界对我国是否陷入低生育率陷阱及是否需要全面放开限制并鼓励生育的争论为引子,通过梳理代表性观点,发现争论的原因在于,对真实生育率水平的判断、对人口在发展过程中的价值识别以及对人口与经济主体地位的认知不同,存在将生育率客观问题主观化、缺乏统一而清晰的人口发展战略规划、注重宏观层面的经济考量而輕视微观层面的人文关怀等潜在缺憾,导致更多地陷入了理论的争论,而忽视了现实问题的解决。新时期唯有提高人
期刊
伴随着当下信息时代的高速发展,大数据相关的应用成为了业界关注的焦点,通过数据驱动经济发展已成为全球许多强国的战略计划之一。然而人们由于认知不足或犹豫不定等原因导致获取的信息存在不确定性,因此得到的数据为不确定性数据,通常不能用一个精确的数值来表示。为了解决数据不确定性的问题,有学者提出了犹豫模糊集合等相关概念,在实际决策分析中具有重要的应用价值。本论文则针对当前犹豫模糊聚类算法存在的一些问题,进行了如下研究工作:
  1.规范定义了犹豫模糊集合的相关概念。已有相关文献中对于犹豫模糊集合的概念定义不完
复杂活动识别是普适计算的重要研究方向,复杂活动是相对于简单活动而言对用户活动的定义,简单活动指由用户身体动作定义的活动(例如,走路,坐着,跑步等),而复杂活动是指具有语义的日常生活活动(例如,吃饭,看电影,购物等),因此识别复杂活动更能反映用户高层次的活动行为。
  相比于传统的基于视频图像的活动识别方法,基于移动传感器的活动识别方法具有成本低、灵活、可移植性好的特点,因此成为活动识别领域的研究热点。识别复杂活动需要各种形式的传感器联合识别,现有的面向多模态传感数据的复杂活动识别方法主要有两种,一种