基于支持向量机的用户行为异常检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:newrevon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测作为入侵检测的一个分支,越来越受到人们的重视。大部分入侵检测系统对于内部攻击的检测效率很低。内部攻击者比外部攻击者会对系统造成更大破坏,而且其行为更难捕捉。对用户的行为建模是一种有效的检测恶意攻击的方法。随着假冒入侵行为的出现,任何新的异常行为模式都应该通过用户命令行数据被观察到,越早发现越好。  尽管利用UNIX用户命令行数据的异常检测技术在很久前就被认为是弥补误用检测和使用程序数据的异常检测技术缺陷的有力途径。但由于其低精确率和相对过高的误警率,迟迟没有得到广泛应用。在本文中,我们论证了机器学习领域的一种方法SVM(支持向量机)是一种更有效的用户行为异常检测方法。  论文首先分析了入侵检测技术。着重分析异常检测的发展和目前待解决的难题。分析了UNIX系统shell命令的特点及支持向量机分类方法的相关理论。深入分析了支持向量机理论应用于异常检测系统中的可行性,简要介绍了与本文相关的其它用户行为检测的研究,指出其中的可取之外与不足。  然后,为提高基于SVM组合多类分类器的性能,本文提出了一种基于One-ClassSVM对正常用户行为进行建模的方法,通过UNIX用户命令序列来区分正常用户行为和假冒正常用户的入侵者行为或者正常用户的误用行为。从每个用户中选取一些shell命令行数据作为训练数据,剩余的用于和非本用户的数据混合进行测试。然后,我们通过不同的特征提取方法得到的不同的输入数据进行实验。  接着详细设计了从用户shell命令中提取特征的过程,通过多组对比实验发现更适合用户行为特征分类的特征提取方法。并通过对shell命令行反复实验和详细研究UNIX系统shell命令的特点,把命令流中的原符号按照用户行为的特点归并同类,通过这一措施使原来1936维的高维特征向量最终降为135维的特征向量数据。提高了用户行为分类的效率。得出了通过分类来降维的方法,同时产生了用于UNIX用户行为特征提取的基本可参考方案。  当发现每个用户的行为模型都对其它用户行为有很高的误接收率时,我们引入了会话内的投票机制来消除这一不足,并使实验整体的正确检测率大幅度提高,与以往其它方法的实验相比得到更令人满意的结果。  然后,通过使用不同参数的提取特征的方法得到特征向量作为实验数据重复对比实验,通过对实验结果的分析,做出对不同特征提取方法的评价。
其他文献
随着Internet的迅速发展,网上信息以爆炸性的速度不断丰富和扩展,搜索引擎成为获取信息的必需工具,而网络爬虫作为网页收集工具是搜索引擎的核心组成部分。随着互联网信息量的增
高光谱遥感图像分类是图像研究领域的新热点问题,具有广泛的应用前景。随着近年来关注度的持续上升和研究投入的不断增加,已经取得一定的技术成果。然而,由于高光谱遥感图像本身
图像修复是根据一定的规则对图像中的信息缺失的部分进行填充修复的算法,要求修复后的图像能够尽量与图像中原有的部分保持连续,平缓过渡。图像修复是图像处理中的一个重要课题
在对等网络、网格及服务计算等系统中,许多分布在不同组织和位置的参与节点需要共享其他节点的资源或协作共同提供服务,这些系统称为开放分布系统,它们都是建立在Internet基础设
图像超分辨率重建是计算机视觉领域中一个研究热点,有广阔的应用前景和实际应用价值。它主要关注在硬件设备性能受限的情况下,从所获取的单幅或者多幅图像中,设计算法尽可能提高
步态分析与评价是人类保健和康复的重要研究内容。随着人类老龄化的逐渐加剧,老人意外跌倒已经成为老人致残的“杀手”。对人类步态进行深入分析和科学评价已经成为很多发达国
随着移动通信技术的飞速发展,移动通信的网络带宽不断增加,移动终端的处理能力也在迅速提高,通过移动通信网络提供流媒体服务已经成为可能。全球移动用户的数量非常庞大,截至
随着计算机信息处理技术及计算机应用的日益普及,少数民族文字的计算机信息处理也开始成为计算机应用领域的一个重要研究方向。 藏语是少数民族的一大语系,藏族人民有着两千
生物信息学是随着人类基因组计划的启动、基因序列和蛋白质序列等生物数据迅猛增加而逐渐兴起的一门通过综合运用数学、计算机科学和信息科学来研究生物系统中信息现象的科学
以协同工作平台服务系统为背景,为提高协同任务调度的柔性及软件的构架性能,对协同任务调度领域模型及软件构架模型进行研究。研究协同任务调度的概念框架,明确提出任务调度