基于机器学习的JavaScript恶意代码检测系统的研究与实现

来源 :北京邮电大学 | 被引量 : 11次 | 上传用户：XX200003

【摘要】

：

随着Web技术的发展,网站与用户交互的方式越来越丰富,这就导致了用户在网站上的隐私或者资料容易被不法分子截获或者窃取。其中,由于JavaScript可以与后台通信,使用广泛的特

【作者】

：

吴宏程

【出处】

：

北京邮电大学

【发表日期】

：

2018年01期

【关键词】

：

JavaScript 混淆恶意代码检测分类机器学习深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Web技术的发展,网站与用户交互的方式越来越丰富,这就导致了用户在网站上的隐私或者资料容易被不法分子截获或者窃取。其中,由于JavaScript可以与后台通信,使用广泛的特点,导致其成为了用以Web攻击的主要工具。随着Web检测工具的不断出现,攻击者保护攻击程序不被检测的手段也越来越多。目前常用的方法就是对代码进行混淆,但是混淆手段也常被机构用于保护代码版权,所以如何有效准确的识别出混淆恶意代码就变得很关键。本文利用机器学习来检测基于JavaScript的Web攻击,设计了可以识别JavaScript是否为恶意代码及具体哪种恶意类型的方法并利用识别恶意代码的方法实现了可实时检测网页代码的Chrome扩展工具。具体成果有:1)通过对数据集进行代码的特征分析,我们提出了使用协同训练的方法来识别JavaScript恶意特性的检测模型,该模型基于两类特征的可信度实现了小数据集的数据扩充,以使模型达到更加精准的分类效果。实验表明,我们的方法在训练集比例调整的情况下也能保持较高的准确率,基本解决了第一段提出的问题。2)通过对恶意代码进行类别分类,我们提出了基于深度学习的恶意代码分类模型,该模型可以准确识别代码的局部特征,为检测结果提供了良好的特征基础。我们使用了简单交叉验证来评判我们的模型,实验结果证明,我们设计的分类模型是可靠的。3)最后,构建了 Chrome扩展工具,将设计的识别方法用于了网页的实时检测。实际运行结果表明,这是一个有效的实时检测工具。

其他文献

“互联网+”时代下高职学生志愿者工作运行与管理机制研究

"互联网+"是互联网思维的进一步实践成果,在此背景下研究高职学生志愿者工作的运行和管理机制有其重要的现实意义。基于此,就"互联网+"背景下的高职学生志愿者工作进行研究,

期刊

“互联网+”高职学生志愿者工作

杨浦区提升中小学(幼儿园)课程领导力行动研究项目初态调研报告

通过对上海市杨浦区提升中小学(幼儿园)课程领导力行动研究项目中21所项目实验校进行走访调研和文本分析,了解各校目前的课程领导力发展现状,明确优势与不足,进而厘清学校项

期刊

杨浦区课程领导力初态调研

历史教学中的单元整体设计

对单元内容进行整体性设计,有助于加强单元目标与课时目标之间的联系,有利于揭示历史发展的总体趋势和阶段特征,有利于教学资源的有机整合。教师应该对教材内容和教学目标进

期刊

历史教材历史教学单元教学

高校食堂送餐管理模式探讨

随着互联网的迅速发展,美团外卖、饿了吗、百度外卖等网上订餐方式受到了大学生的欢迎,订外卖送餐到寝室已经占据高校学生就餐方式很大的比例。但是订餐存在着食品安全、校园

期刊

食堂送餐管理高校

中高职衔接人才培养模式下的学生管理

在教育教学改革背景下,我国推行"3+2"的中高职衔接人才培养模式,对高职院校的学生管理提出更高的要求,如何优化中高职衔接人才培养模式下的学生管理方法,成为摆在高职教育工

期刊

中高职衔接人才培养模式学生管理方法创新策略

基于核心素养的习作教学探究

<正>过去几十年,以知识为核心的应试教育一直大行其道,在经过了几轮轰轰烈烈的课程改革之后,如今的教育正朝着"核心素养"时代前行。小学习作教学作为语文教学一个重要的组成

期刊

习作教学核心素养阅读评价

基于奇异值分解图像压缩算法的研究

提出了一种奇异值分解(SVD)的图像压缩算法,该算法通过对数字图像矩阵进行奇异值分解,将一幅图像转换成包含几个非零值的奇异值矩阵,实现图像压缩,便于图像的储存和传输。MAT

期刊

奇异值分解图像压缩压缩率

奶牛蹄病的诊断及防治

<正>奶牛蹄病是奶牛生产中的常见病,是目前国内外发病率较高的疾病之一,与乳房炎和繁殖力降低构成奶牛饲养业三大制约因素。其轻则引起奶牛跛行,重则引起奶牛瘫痪,如不加以重

期刊

奶牛蹄病诊断防治

呼伦贝尔草原、湿地和森林植被对气候变化的响应

气候变化会影响区域生态系统的结构和功能。植被覆盖状况是研究不同类型植被对气候变化响应的重要指标。采用遥感与GIS技术,对1981~2012年呼伦贝尔草原不同植被类型的植被变

期刊

呼伦贝尔草原湿地森林气候变化响应规律

日语副词的动词用法认可度问题——以?うっかり+する?为例

本文运用语料库对?うっかりする?的具体使用情况进行了调查统计与分析,在此基础上,对中道真木男(1991)的研究中与本研究中所对应的考察项目进行了对比分析。研究数据表明中道

期刊

动词用法认可度语料库使用频数

基于机器学习的JavaScript恶意代码检测系统的研究与实现

与本文相关的学术论文