基于抽象语法树的Webshell检测研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yadnlf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展给人们的生活带来了便利。然而,随着人们将越来越多敏感的数据存储在网络空间中,这些汇聚着敏感信息的网站成为了诸多入侵者的攻击目标。Webshell是一种网页后门,它们被广泛地用于对网站的攻击中。Webshell的检测方法分为静态检测方法和动态检测方法两种。传统的静态Webshell检测方法通常针对单一类型的Webshell,并且它们使用的传统文本特征对Webshell的表征能力较弱,检测算法拟合能力较弱,因此对变形Webshell的检测准确率较低。因此本文基于结合抽象语法树和Text-CNN神经网络,提出了一种针对PHP和JSP Webshell的混合检测模型。本研究的主要贡献如下:1.通过爬虫从互联网中采集样本,生成用于支持本文研究的包含PHP和JSP Webshell和正常脚本的数据集。为了确保实验环境贴近现实,使检测模型更具鲁棒性,数据集中收集的正常样本的数量远超Webshell数量。数据集包含了2177份Webshell和11905份正常脚本,囊括了最新和PHP和JSP免杀Webshell以及各种“大马”,“小马”和“一句话木马”。2.传统基于文本特征的Webshell检测方案存在恶意特征过时等问题,本研究通过对新型免杀Webshell的研究,补充了大量最新的PHP和JSP Webshell特征和统计学特征,提出了基于XGBoost和文本特征的Webshell检测方案。本研究通过与不同机器学习算法进行对比实验,发现基于文本特征的Webshell检测方案能有效检测出常见的Webshell。3.抽象语法树能够更好地反映代码的实际逻辑,因此能有效地反映脚本的特征。本研究通过改进传统的抽象语法树特征提取方案,结合Text-CNN神经网络,提出了基于改进抽象语法树和Text-CNN的Webshell检测方案。在与多种机器算法和神经网络的对比实验中发现,本研究提出的方案能够最有效地完成PHP和JSP的Webshell检测任务,并在测试集中取得了近99.5%的检测准确率。最后,本研究从工程实现的角度出发,结合两种检测方案的优势,设计并实现了一套Webshell检测系统。
其他文献
此次翻译实践项目的源文本选自2019年斯普林格出版社出版的《智慧城市的现在与未来》(Smart Cities of Today and Tomorrow)一书。所选译的三、四两章介绍了与智慧城市建设紧密相关的城市基础设施,强调了网络安全的重要性。翻译实践的目的是给国内智慧城市建设提供参考,让大众对智慧城市这一概念有更深刻的理解。通过分析发现,原文本属于科技英语类,主要具有以下特征:大量术语和缩略词
学位
隐私权是现代社会的一项重要权利。而大数据侦查的运用则意味着执法活动向情报活动的转移,同时也意味着国家对公民信息的全面掌控。隐私权所追求的是将个人事务“隐之于私”,而大数据侦查则需要收集海量的数据使信息“公之于众”,二者存在天然的冲突。刑事诉讼的目的,一方面在于打击犯罪,另一方面在于保障人权。因此,必须平衡大数据侦查运用与隐私权保护的关系,二者不可偏废。大数据侦查作为一种新兴的侦查措施,本身就存在诸
学位
报纸
人类社会已进入第四次工业革命,信息技术成为了重要的生产力,新的科技成果和突破不断影响着人类文明的发展。本研究正是在这一背景之下,收集了约16万字的信息科技语料,并从中提取出2万字左右的有效语句为研究对象,旨在研究并总结IT英语中“and”及其并列结构的翻译技巧。本研究选择福柯尼耶(Fauconnier)和特纳(Turner)提出的概念整合理论作为指导,基于该理论中的“四空间论”,采用对比分析法、假
学位
做好意识形态工作需要统筹国内国际两个大局,既要提高意识形态的国内影响力,也要提高意识形态的国际竞争力。从内在结构来看,意识形态系统是由“价值—观念体系”“认知—解释体系”“制度—规范体系”和“行动—传播体系”等要素构成,在具体运行中表现为价值引领力、制度规范力、认知解释力和行动传播力,这些力相互依存、相互影响。从这四种力出发,可以对中西方意识形态进行比较,研判我国意识形态安全所面临的总体态势。提升
期刊
随着大数据、信息技术逐渐兴起并运用于金融领域,数字普惠金融如何发挥普惠性,进而助力农业农村的发展,已成为研究的热点话题之一。文章以贵州省为研究对象,从贵州省农业发展状况入手,探究了目前贵州省数字普惠金融支持农业农村发展的现状与存在的问题。研究表明,目前贵州省数字普惠金融的发展在政策的支持下,涉农贷款持续增加,农村金融服务不断提升,促进了农业产业化和绿色农业的发展,但仍然面临信用风险、人才短缺和“数
期刊
聚类作为机器学习中一种常用的算法,已广泛应用于信息检索和模式识别等诸多领域。目前,机器学习中数据集往往呈分布式存储模式,并且数据所有者缺乏充足的存储与计算能力。随着云计算技术的发展,机器学习能够结合云计算的优势,提高分布式数据集的有效利用并解决数据拥有者资源受限的问题。然而,云外包机器学习要求参与者提供原始数据或部分训练参数,可能会导致参与者隐私信息的泄露。隐私计算技术能够在不泄露原始数据的前提下
学位
近年来,随着大量公共安全和交通基础设施摄像头的安装,视频分析已成为了公共安全治理领域中重要的组成部分。此外,随着网络摄像头数量的增加,视频数据量激增,导致传统云计算系统无法实现实时视频分析。目前,将计算任务卸载到更近的边缘端已成为趋势,但边缘控制器中也存在计算资源不足的问题。将边缘计算和云计算相结合,有利于实时目标追踪系统的实现。同时,实时目标追踪有利于降低犯罪率,营造一个安全、和谐的社会环境。本
学位
本文是一篇翻译实践报告。源文本节选自《精神分析法与数字文化——受众、社交媒体和大数据》(Psychoanalysis and Digital Culture:Audiences,Social Media and Big Data)的第6章。该文本运用精神分析法中的反常概念,探究当代数字媒体平台与用户之间的反常关系——数字媒体平台在进行数据挖掘时,既关爱用户,也伤害用户。源文本进而论证了数字媒体上的
学位
区块链技术是比特币等数字货币的底层核心技术,其融合了P2P网络、密码学技术、共识机制和智能合约等关键技术,具有去中心化、不可篡改、可追溯和安全存储等特性。由于上述特性,使得区块链技术被广泛应用于数字资产交易等诸多领域。然而,由于区块链上的数据公开可见,恶意用户可以收集和分析区块链上的交易记录威胁交易双方的身份隐私安全,严重影响了区块链的应用和推广。虽然研究人员们提出了一些区块链隐私增强方案,但这也
学位