论文部分内容阅读
随着信息化的飞速发展,网络安全事件日益剧增,而对于入侵检测也成为热门的话题。国外的银行、警察署服务器、国家电网等重要行业均遭受到不同程度的威胁,且损失较为严重。在2015年,国内因个人信息泄漏、垃圾信息以及网络诈骗而造成的损失约805亿人民币。有效的控制入侵事件的发生,是目前安全领域亟需解决的问题,高效的入侵检测包含高检测率和高时间效率两个方面。本文针对这两方面进行了展开研究。 本文根据国外的入侵检测的框架,基于密度聚类的方法对入侵检测进行了研究。在本文中主要做了以下的工作: (1)改进了密度聚类的算法。针对网络安全高维数据KDD99进行的改进,为了提高数据集的检测率进行优化。主要是在国外的研究学者Alex的研究基础上做了改进,其算法对低维数据聚类效果较好,但是针对高维数据效果不明显,故本文对其算法进行了高斯核改进。 (2)研究了距离公式对聚类实验的影响。针对大多数学者在距离化的过程中选择了欧式距离,但并没有实验论证对其选择距离公式原因。故本文选择五种距离公式进行分析,并进行实验对其验证,在本文的实验中,哪一种距离化公式最优。 (3)实现了高维数据的降维处理。针对实验程中的KDD99数据进行距离化的过程中,消耗的时间较多,故实验中增加了PCA降维的环节,来降低其数据集的维数。在保证高的检测率过程中,提高了时间效率。