论文部分内容阅读
随着互联网技术的飞速发展,网络攻击充斥着我们的生活,黑客技术的提升使得传统防护手段难以有效应对变化多样的木马攻击。针对现有木马检测方法存在着普适性差、检测时间长等问题,为进一步提高检测的效率,设计一种高效的木马检测方案具有十分重要的意义。本文结合K近邻算法和Kmeans算法的优点,提出一种针对木马行为检测的提速K近邻分类算法CBBFKNN。CBBFKNN分类算法使用超长方体区域划分思想对训练集中的样本数据进行降维,采用Kmeans算法对降维后的样本数据进行聚类,引入模拟退火算法确定最优的聚类中心以避免Kmeans算法在选取聚类中心时陷入局部最优解,在聚类后的训练集上构建kd-tree。使用BBF算法的思想,在查询过程中记录查询路径上训练样本与待测样本间的距离,回溯检查优先级最高的K个训练样本,确定待测样本的类别。然后基于CBBFKNN分类算法提出一种木马行为检测方案,“核心模块提取行为特征模块”采用WinSock实现,“核心模块分类处理模块”采用CBBFKNN分类算法实现,使用准确率、误判率、漏检率以及检测的时间作为木马行为检测方案的评估标准。为验证CBBFKNN分类算法的有效性,在Iris数据集上对算法进行验证,结果表明CBBFKNN分类算法能够在准确率损失较小的情况下降低分类的时间。为验证木马行为检测方案的有效性,分别对方案中的提取行为特征模块以及分类处理模块进行验证。实验结果表明提取行为特征模块能够有效截获局域网内的数据流量,分类处理模块与SVM、朴素贝叶斯、K近邻算法相比能够保证较高的准确率以及较低的误判率和漏检率,并且能够更快的检测出木马,验证基于CBBFKNN算法的木马行为检测方案具有一定的可行性和有效性。