基于Smith-waterman的应用层协议特征自动提取算法的研究与实现

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:relaxfor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,网络应用层出不穷。为了更好的了解用户使用的网络应用类别和分析网络提供给用户的服务质量,网络服务供应商(ISP)的管理人员的一项重要任务就是识别和分类流经网络的流量。传统的识别和分类技术,比如基于知名端口号的识别方法,已经不再准确,现在广泛研究和使用的技术是机器学习方法、应用层协议行为特征方法和基于载荷的方法。在所有这些方法中,深度包检测技术(DPI)(基于载荷的一种技术)是目前最常用和最准确的方法。但是这个技术要求ISP的DPI设备必须有一个完整准确的应用层协议特征库。传统的构建这个特征库的过程非常耗费人力物力,并且提取的特征的准确性很大程度上依赖提取人员的经验值。这篇论文在对多种应用层协议,尤其是P2P协议,的载荷进行研究后,提出了应用层协议特征自动提取算法,讨论了该算法的性能和准确性,阐述了特征签名的出现方式、表示方式以及检测算法,并对算法的有效性和准确性进行了验证。本文的主要工作和贡献包括:(1)介绍相关领域的研究现状,综合比较基于端口号、基于IP地址、基于机器学习、基于协议行为特征以及基于载荷的识别方法的优缺点。(2)设计实现了纯净流采集工具,该工具通过抓取网卡数据包,并结合进程名称把流量按照五元组进行分类。(3)定义特征字符串,分析特征字符串的出现规律,这些规律能够帮助我们在设计算法的时候制订一定的规则。(4)从执行效率和准确性方面比较几种常用的字符串提取算法。(5)设计实现应用层协议特征提取算法,该算法能够自动提取协议的特征字串,并通过出现频率来进行一定的提纯操作。(6)验证自动特征提取算法的准确性。通过把得到的特征字符串应用于DPI原型系统中,检测识别的准确率。
其他文献
SaaS(软件即服务)是近几年新起的一种新的软件交付和商业模式,并且随着云计算概念的提出和普及,SaaS成为了标准的云应用层模型。多承租架构是SaaS型软件的核心实现技术,该架
数控系统中的运动轨迹控制技术是确保数控高速、高精以及高表面质量加工的关键技术,也是评价数控系统性能的重要指标。国内外相关研究机构及各大数控系统开发厂商均将其作为努
电力系统的无功优化是提高电能质量、降低网络有功损耗和保证电力系统经济安全运行的重要措施。随着社会的发展和人口的增加,电力系统的负荷急剧增加,因此对能稳定的应用到更大规模电力系统无功优化问题的新的优化计算方法的研究是有重要意义的。社会情感优化算法是一种新的模拟人类行为的群智能优化算法,本文首先对社会情感优化算法做了具体的描述:为模拟人类能够利用自身的情感准确决策的能力,社会情感优化算法构建了情感集和
在传统机器学习中,为了保证训练得到的分类模型具有高准确性和可靠性,都有两个基本的假设:(1)用于学习的训练样本与新的测试样本满足独立同分布条件;(2)必须有足够可利用的训练样
随着各个行业对计算能力需求的不断增长,云计算得到了迅猛的发展。云计算通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的系统,将大量计算资源统一管理和调
命名实体识别是指识别出句子中具有特定含义的名词,它是信息抽取、自动问答、机器翻译等自然语言处理任务的基础工作之一。手机3D动画自动生成技术由陆汝钤院士于2008年提出,
网络与信息处理技术的飞速发展使人类进入了大数据时代,数据量呈指数级增长,各行各业都面临海量数据处理的压力。自治区某物联网系统中的应用日志还停留在手工排查阶段,排查日志
随着超级计算技术的发展,超级计算能力有了大幅提升。与此同时,以资源聚合为目标的超级计算环境建设方兴未艾,从网格计算到云计算,如何将分布的超级计算资源整合在一起,对外提供统
工作流技术最早出现在生产组织和办公自动化领域,其目的是为了实现企业经营过程的计算机化或者半计算机化。随着计算机技术的不断发展,工作流技术也得到了飞速的发展,并在各
因特网的普及和视频点播等新业务的出现导致网络流量急剧增加,此时传统的网络流量特征已经不再适用于网络流量预测。研究人员对局域网、因特网的流量进行测量后发现,网络流量