基于深度学习的跨站脚本检测

来源 :贵州大学 | 被引量 : 0次 | 上传用户:mario0798
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,网上用户信息泄漏事件频频发生,跨站脚本检测作为网络攻击检测的一部分,是网络安全领域研究人员的研究重点之一。传统的跨站脚本检测技术大多使用机器学习方法,存在代码被恶意混淆导致可读性不高、特征提取不充分并且效率低等缺陷。因此,本文提出了构建基于深度学习的XSS检测模型,有效地提高了模型对跨站脚本的特征提取能力,提高了模型检测的准确率并降低了模型检测的误报率。本文主要工作如下:1.分析了跨站脚本代码的特性,总结出XSS代码中存在局部关联性和长距离依赖的特性,并对这两个特性进行深入研究,得出两个特性之间并没有前后关联性的结论,基于该观点来构建模型验证这一结论。实验中,利用爬虫工具收集了10万余条样例数据包含XSS样例和正常样例,为了提高数据的可读性,利用多种解码技术解决样本数据的混淆问题,并运用word2vec将文本形式的样本数据转化为词向量数据。2.由于跨站脚本存在着上下文的长距离依赖的特点,如开始标签与结束标签之间存在着长段无意义的语句,而现有的长短时记忆网络模型在提取跨站脚本代码中下文对上文依赖特征存在着缺陷,本文构建双向长短时记忆网络模型来充分提取跨站脚本的上下文依赖特征,并运用softmax分类器实现跨站脚本检测。实验验证,与单向长短时记忆网络模型相比,双向长短时记忆网络模型提取的特征更为充分,检测准确率提高了1.5%。3.由于跨站脚本存在局部相关性高和长距离依赖的特点,而双向长短时记忆网络模型提取的特征中忽略了局部特征且有与跨站脚本相关性不高的信息,本文应用注意力机制改进Encoder-Decoder框架,针对局部关联性和长距离依赖性这两个特征关联性不高的特点,由卷积神经网络和双向门控循环单元网络并行构成Encoder,既考虑跨站脚本的上下文信息又提取局部信息,充分提取有效特征;其次,使用注意力机制计算输入数据对跨站脚本的注意力权重,解决传统Encoder-Decoder模型框架的“分心问题”,最终得到了准确率为99.27%、误报率为0.05%的检测效果。
其他文献
利用镉超富集植物(cadmium hyperaccumulator)对镉(Cadmium,Cd)污染土壤进行植物修复是较为简便绿色的手段。伴矿景天(Sedum plumbizincicola)被认为是最强的镉超富集植物之
QR(Quick Response)码是目前应用最广泛的条形码,其所具有的大数据容量、全方位识读及自我纠错能力等优点使其拥有广阔的应用前景与发展空间。但当前的QR码主要用于存储公共信息,任何人都可以识别并获取其中的信息,这使得QR码在安全性方面存在一定的缺陷,不利于存储秘密信息。本文提出了一种基于QR码的加权可视密码,旨在将方便快捷的QR码应用于秘密共享领域,提高秘密共享与信息存取的便捷性与安全性
近年来,随着我国经济迅速发展,各类轻工业如纺织业、造纸业等随之迅速发展,导致相应染料的用量及其废水的排放量逐年增加。而染料废水的高色度,高有机物含量使其在现有常规污水处理工艺中无法得到有效处理。因此国内外开展了大量关于处理染料废水的研究,其中物理去除技术的生物炭吸附法具有易操作、成本低和效率高等优点而成为一大热门方向。有关吸附剂的研究中,具有丰富孔状结构的植物基生物炭得到广泛关注。本课题组相关研究
  小间距双幅同转转体桥精度控制施工技术是在跨线桥梁承台上,增加特制钢球铰做为转动和承载的核心,撑脚和滑道做为防倾覆保险体系,牵引索、连续张拉千斤顶和反力座为转体的施
蒺藜(Tribulus terrestris L.)为蒺藜科一年生草本植物,其全株、果实、根、茎、叶、花都可入药,被誉为“草中名药”,具有抗炎、抗氧化、抗菌和抗肿瘤等多种药理作用。蒺藜含有皂苷、黄酮和生物碱等多种化学成分,其中主要成分为皂苷类化合物。皂苷类化合物具有抗肿瘤、降糖、抗炎、提高免疫、心血管和神经保护等生物活性。脂多糖(LPS)是革兰氏阴性菌细胞壁中的一种内毒素,可以诱发炎症反应,激活先
随着专利转化对社会发展的重要性日益凸显,并且自1999年上海市政府出台专利资助政策以来,我国地方政府纷纷出台相关的专利资助政策,根据不同地区的情况,制定不同专利资助政策
无人机全景航拍图像满足了人们对宽视场及高分辨率图像的追求,在灾后救援、矿产勘探、现场取证等多个领域得到广泛应用。为了保证图像的高分辨率,无人机需要在受限的高度飞行,这时单幅图像的视野过小,无法提供足够的有用信息。若采用广角摄像头拍摄,采集到的图像会存在较大的失真,不适用于对图像真实感要求较高的技术领域。因此,当使用普通相机进行航空拍摄时,需要在大视野范围和高清晰度之间做出取舍。为了打破这一技术壁垒
近年来,伴随着我国快速的城市化进程,以灰色设施为主的城市防洪排涝安全工程建设,对流域-城市的水生态系统造成了严重的破坏,加上我国在城市雨洪管理体制上存在着不足,加剧了我国城市的雨洪灾害风险。海绵城市作为新一代的城市规划建设方式,能够有效提高我国雨洪管理能力、降低雨洪灾害风险,自提出以来就得到了我国各级政府和相关学者的高度重视,并在各地积极的展开了实践探索。然而,目前海绵城市的建设存在着局限城市内部
深度学习的飞速发展直接促进了计算机视觉领域的发展,使其更广泛地服务于人类社会。图像风格迁移就是一项计算机视觉任务,是将一张图在内容不变的情况下变换成具有另一种风格图像的操作。很多研究人员利用深度学习在图像风格迁移方面取得了很好的研究成果,Goodfellow 提出 GAN(Generative Adversarial Network,生成对抗网络)后,更是为风格迁移研究打开了一扇新的大门。本文运用
随着生产生活中含油污水的大量排放以及海上原油泄漏事故的频发,水中油污染已成为危害人类健康和环境安全的重大问题。如何实现高效的油水分离已成为亟待解决的难题。具有特