论文部分内容阅读
为了有效分类恶意软件,将文本挖掘技术应用到恶意软件分类中,通过代码串提取方法提取结构化的代码串,再使用层次聚类算法将恶意软件聚类成恶意软件家族。然后使用文本挖掘中提取关键字的计算方式设计恶意软件家族特征向量提取算法,给出公式定义、提取特征向量算法流程和代码实现。最后设计分类器,给出距离计算公式和分类算法流程。编程实现了层次聚类算法、恶意软件家族特征提取算法和K-NN分类算法。实验结果表明,基于文本挖掘的恶意软件分类方法可有效准确地对恶意软件分类。