基于机器学习的校园网流量准确预测

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:lygwzs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化进程的不断深化,各大高校对校园网网络的发展建设越来越重视,网络教学、网上学习已经成为了高校教学工作中的常规手段,而校园网与信息化的建设速度更是直接影响到教育信息化的发展速度。丰富的网络资源、广大的用户需求和频繁的使用频率导致校园网的网络规模变得越来越大,伴随而来的便是对校园网的管控尤其是流量管控方面上的难度日益加大。对于校园网管理者来说,随时掌握网络的运行状况和精准的流量预测已经成为了网络安全工作的必要内容。传统的流量预测方法是采用自回归移动平均(ARIMA)模型,它是通过自身的过去值、过去误差、线性组合来预测未来的时间序列,是时间序列分析中最常用的模型之一。但ARIMA模型要求数据的平稳性,所以本质上只能捕捉线性关系,无法对复杂的校园网流量进行精确的预测。而随着计算机技术的迅猛发展,机器学习技术开启了“人工智能”的新时代,其在数据挖掘、语音识别处理、自然语言处理等领域都取得了突破性的进展,也给关于网络流量的预测带来了新的机遇。基于此,我们尝试通过机器学习技术建立一个符合校园网流量复杂特性的模型用来实现对校园网流量的分析及精确预测,在一定程度上可以提升校园网的流量管控及安全监测能力。通过以上分析,本文进行了基于机器学习的校园网流量准确预测的具体研究,重点开展使用不同的机器学习方法来对校园网流量进行预测,并通过调整参数、加入多维度特征、融合模型的操作来达到预测结果的最优化。论文的主要研究工作及取得的成果如下:基本包含三部分工作:1、有关网络流量预测的前期调研、北京邮电大学校园网流量数据的准备和机器学习相关内容的学习。具体包括相关领域的研究现状及主要技术调研,流量数据的收集、转换、清洗、特征提取等工作,机器学习框架及相关预测模型的对比及选择。2、采用循环神经网络(RNN)中可解决长时间依赖问题的长短期记忆网络(LSTM)模型来实现对校园网流量的预测,通过不断地调参及优化,该流量预测模型的误差达到15.7%。3、通过对LightGBM、随机森林(RandomForest)、梯度提升回归树(GBRT)这3种机器学习回归模型以及基于校园网流量特征提出的“星期-小时-分钟”的流量均值模型进行集成学习来实现对校园网流量的预测,将预测模型的误差缩减到6.52%。本文通过分析校园网的流量数据特征,采用了长短期记忆网络(LSTM)模型和集成学习模型分别对实际的网络数据进行预测。在集成学习模型中,本文创造性地提出了基于校园网流量特征的“星期-小时-分钟”的流量均值模型,同时为了达到精确预测的目的,还挖掘了一些时间维度特征(如.:是否为工作日)和校园的信息特征(如:是否为考试周)以完善该网络流量预测模型,最终将预测误差降至6.52%。另外,为了评估当前模型对校园网流量预测的准确度,本文不仅对不同的机器学习模型做了多维度的比较,还加入了与传统的时序预测模型ARIMA的比较。实验表明,基于机器学习方法对校园网流量建立的预测模型可以达到比较好的效果。
其他文献
页岩中含有丰富的孔隙裂隙,其中的纳米级孔隙具有高的比表面积、强的吸附势能,能够为吸附态气体提供大量的吸附位点和吸附空间,在页岩气的富集形成中起到重要作用。因此,弄清
我国《婚姻法》明确禁止重婚和有配偶者与他人同居。在现实生活中,确实存在部分已有配偶者婚外与他人同居,此类同居关系还引发了一些难解的法律问题。在与婚外异性同居期间双方
党的十七届六中全会提出建设社会主义文化强国的战略目标,并把文化产业作为增强文化软实力的最重要的途径。同时,发展文化产业是推动浙江文化大发展、大繁荣的重要途径,是实
1病例患者男性,50岁.因龟头部发生红斑,群集性丘疱疹4天,于2003年9月5日就诊.患者4天前无明显诱因发现龟头出现小片状红斑,2天后即发现群集性丘疱疹,发病前后均未发现皮损处
氧化锌是宽禁带(3.3ev)直接带隙n型半导体材料,并且具有较高的激子束缚能(60ev)。这使其成为紫外激光器和真空荧光显示的理想材料。在荧光显示方面,人们比较关注的是ZnO薄膜蓝-
目的:通过对山西省太原市山毛社区老年高血压病缓解期人群的现况调查,了解太原市城乡地区该人群的流行病学特征,同时研究其相关危险因素及中医体质分析,为社区老年高血压病中医干预方法及防控策略提供依据。方法:收集2015年3月-2016年3月在山毛社区例行体检的老年高血压病人群585例,运用“太原市区域卫生信息平台”中慢病管理系统中的高血压病资料,填写居民健康管理档案表及中医体质量表。内容包括:一般资料、
共振隧穿二极管〔RTD〕是一种新型的基于量子共振隧穿效应的两端高速器件,已经在多态存贮、A/D转换、多值逻辑、分频、倍频等方面得到了广泛的应用。RTD器件的快速发展和良好
随着计算机技术、通信技术和控制技术的发展,传统的工业控制领域正经历着一场前所未有的变革,开始向网络化方向发展。对诸如图像、语言信号等大数据量、高速率传输的要求,催生了
建立了一种快速简便的测定土壤中铵态氮的方法。土壤中的有效氮加碱蒸馏,用硫酸吸收,全部转化为铵态氮,NH4^+在碱性溶液中能还原ClO^-,该反应和化学发光反应ClO^--Luminol相耦合,通
本论文的主要任务是研究在蓝宝石(0001)衬底上利用射频等离子体辅助分子束外延(rf-MBE)系统生长出高质量的氧化锌(ZnO)单晶外延薄膜,为ZnO这一新颖的半导体材料在光电子器件方面得到