基于机器学习的网络业务流量识别技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:mdehuh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网用户群体急剧增长,网络规模迅速膨胀,网络业务类型也变得愈加复杂。为了提供安全、可靠的网络环境,对网络进行高效管理刻不容缓。作为网络管理的核心技术,网络流量识别能够为网络行为分析、带宽资源分配、网络运营管理和网络架构改进提供有力的数据支撑。然而,传统的基于端口号、基于深度包检测和基于行为特性的流量识别方法已经不能满足当前网络流量识别的需要。近年来,人工智能发展迅速,机器学习不断成熟,已广泛应用于各个领域。利用机器学习算法进行网络流量识别,既能保证识别的准确性,又能保证系统的鲁棒性。因此,开展基于机器学习的网络业务流量识别技术研究具有重要的学术价值和应用前景。由于网络流量数据规模庞大、特征属性众多,为了提高流量识别效率,需要进行特征选择以约简特征集合,同时业务流量的类不平衡现象也为流量识别带来了极大的挑战。论文提出了一种基于加权对称不确定性的多阶段特征选择算法,该算法分多阶段筛选特征,首先基于加权对称不确定性计算类别权重平衡多数类与少数类,缓解类不平衡现象并剔除不相关特征;然后基于皮尔逊相关系数判断特征之间的相关程度,筛选掉冗余特征;最后采用禁忌搜索策略寻找最优特征子集。理论与仿真实验表明,该算法实现了网络流量的快速降维,与近年来提出的基于机器学习进行特征选择的算法相比,在特征维度、分类速度和识别精度等方面都表现出较大优势。尽管特征选择有效降低了特征维度,简化了机器学习任务,但使用单分类器进行网络流量识别的稳定性稍显不足。而且,网络流量随着时间推移常常产生概念漂移现象,这对流量识别而言是个极大的考验。为了减弱概念漂移对系统识别性能的影响,论文提出了一种多分类器集成学习算法。该算法基于Bagging集成学习框架,将数据流划分为连续子块,引入自适应窗口机制检测网络流量中的概念漂移,动态调整融合分类器中各基分类器的权重,采用增量学习的策略更新系统模型,组合优化分类结果输出最终预测的应用类别。论文通过实验确定了网络流量数据块的最佳规模和基分类器的最佳数量,理论与仿真实验表明,与单分类器算法和传统的Bagging算法相比,该算法可有效应对概念漂移,提高流量识别的准确性和稳定性。
其他文献
本文研究的是“跨大西洋数字经济对话”(节选)英译汉模拟同声传译实践,作者希望通过对整个口译过程--译前准备、口译过程和译后评估的研究,总结经验教训,不断提高口译能力。
2015年,李克强总理在政府工作报告中提出“推动大众创业,万众创新,既可以扩大就业、增加居民收入,又有利于促进社会纵向流动和公平正义”。创业经营作为创业者依附的载体,将
本报告为2018年2月19日,特威格·弗莱斯纳教授在华威大学发表的关于《国际商法在数字时代的未来发展》的就职演讲的模拟英译汉同声传译的翻译实践报告。译者对实践过程中具体
伴随着国家经济体量的增大与高科技发展的瞬息万变,此时互联网金融作为一个新兴产业,发展速度较快,该行业在进行融资时,主要采取股权众筹的方式且涉及范围较广。然而股权众筹
智能结构能感知周围环境的变化,并针对这种变化作出适当的反应。由于这种优异的性能,智能结构被广泛应用各种工程领域。压电材料结构作为一种智能结构,可以根据自身的特点有
核电作为低碳能源在我国能源结构中占据重要地位,如今中国核电已进入安全高效发展阶段,为保证运行安全,核电厂在停堆换料期间,对所有安全相关传感器和监测仪表进行再校准,对
我国实务中,无独立请求权第三人可直接在他人间的诉讼中被判决承担责任从而受他人间生效判决既判力所及,这种做法符合法律的规定,但在法理上却存在既判力发生的正当程序依据
明万历二十年(1592)四月,日本丰臣秀吉派兵侵朝,壬辰战争爆发。朝鲜因生平日久,不习战事,数月间溃败,大片国土沦陷,被迫向明朝请援。万历皇帝任命宋应昌、李如松为经略、提督
等离子喷焊技术在再制造业中是一种十分重要的表面修复技术。在复杂的喷焊过程当中,合理确定工艺参数对提高喷焊层质量、延长再制造零件寿命极其关键。质量好的喷焊层通常显微硬度比较高、耐磨性比较强,因此本文以喷焊层的显微硬度、磨损量和稀释率作为响应指标,对等离子喷焊工艺进行多目标优化。以H13钢作为基材,以Ni60B、TiC和TaC粉末为喷焊材料,详细的介绍了喷焊层的制备过程。对比多种试验设计方法,在确定喷
随着云计算的快速发展和深入普及,越来越多的应用服务向云平台上开发和迁移。虚拟化技术作为云计算实现资源高效利用以及构建高可用性和高可扩展性云平台的基础,云计算的蓬勃