论文部分内容阅读
在这个信息化的时代,人们获取信息资源主要依赖网页浏览,所以恶意代码的攻击方式也逐渐向恶意网页转变,这给网民带来了极大的安全隐患。恶意网页主要是由脚本语言编写,攻击者为了躲避杀毒软件的检测,通常会利用脚本语言对网页进行混淆加密。目前恶意网页的检测方法主要有静态检测和动态检测两种,静态检测主要是基于特征库检测,检测的准确率依赖于特征库的规模和提取特征的准确度,其对于混淆加密过的网页检测效果较差;动态检测主要是基于沙箱检测,通过监视浏览器与web服务器交互的状态进行判断,如果发现状态异常,则判定恶意。它极大地提高了检测的准确度,尤其是对混淆页面的检测,但是对于大规模的网页检测,效率较低,且占用系统资源较多。针对恶意网页的检测现状,本文设计并实现了一个基于静态检测的恶意网页检测系统,该系统通过特征库匹配技术结合V8引擎技术,对混淆网页进行有效检测;同时利用机器学习算法,选取典型特征向量并建立分类模型对未知网页进行检测。最后对系统进行测试,测试结果显示,系统检测效果良好,达到了预期目标,验证了本系统的有效性。本论文的主要工作如下:1.研究了恶意网页的攻击原理及常见的攻击方式,总结和对比了当前国内外的恶意网页检测手段,并在前人的研究基础上提出了一个基于特征库分级匹配和机器学习分类技术的检测方案。2.设计和实现了一个恶意网页检测系统,本文对特征库格式进行了设计,并通过实验建立良好的机器学习分类模型,同时对基于特征库匹配的检测流程进行优化。系统首先利用特征库分级匹配对网页进行初次检测,然后对未判别的网页利用分类模型进行二次判别,提高了检测的准确度。特征库管理模块实现了特征库自动更新和维护的功能,降低了基于特征库检测的误报率。3.利用收集的测试样本从不同的角度对系统进行了性能测试,详细地介绍了测试过程,并对测试结果进行对比和分析。