基于对抗原理的恶意代码分类器的攻击与防御方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:csmale
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能在图像和自然语言处理领域的成功,研究人员逐步将机器学习技术应用于恶意代码检测领域,并取得了较好的成果。然而从2006年开始针对机器学习模型测试数据的“投毒”到2014年对抗样本的提出,越来越多的研究人员对机器学习模型的安全性产生了担忧。目前防御对抗样本较为有效的方式是通过多种对抗样本与原始样本组合对模型进行训练,这种防御方式被称为对抗训练,可以发现对抗样本不但可以作为攻击模型的一种手段,同时也能够成为提高模型鲁棒性的一种渠道。在利用深度学习技术检测恶意代码中,研究者们利用恶意代码尾部的空隙并结合损失最大化对原始样本进行扰动生成对抗样本,但是这种方法受到样本大小的限制,并且生成对抗样本所耗费的时间较长。如何减少恶意代码检测领域的对抗样本生成成本,以及如何选取合适的对抗样本,这对于模型防御攻击以及提高鲁棒性有着重要的意义。本文针对可执行文件特点,模型的可解释性以及现存的对抗样本生成算法的缺陷,提出了针对黑盒场景和白盒场景下的对抗样本生成算法。本文首先通过找到可执行文件的冗余空间,定位了新的干扰值添加位置,并通过对快速梯度符号方法中加入了一阶矩估计和二阶矩估计来解决单步攻击和迭代攻击存在的耦合问题。在白盒场景下本文通过计算模型对良性样本的判别特征作为扰动值,并对可执行文件添加新的区块作为扰动值添加的位置。本文还分析了加壳样本对模型的影响,使用压缩和加密两种不同的方法对样本进行加壳,发现两种加壳样本均在不同程度下降低了模型的精度。本文最后从L2范数和判别特征两个方面选了择合适的对抗样本,并结合加壳样本和鲁棒性特征样本,来提升模型的鲁棒性。本文在未加壳数据集上,对所提出的两种场景下的对抗样本生成算法进行了验证,主要从对抗样本生成的成功率、时间以及与对抗样本扰动值的L2范数展开,上述两种算法均不再受到样本大小的限制,并且在黑盒和白盒场景下的对抗样本生成算法都能够有效提高对抗样本攻击成功率。本文还在加壳数据集上,验证了模型的精度。最后对比了多种不同的对抗样本和加壳样本对目标模型对抗训练后,并实验观察目标模型精度和鲁棒性的变化,证明了本文针对目标模型的防御方法对提升目标模型鲁棒性的有效性。
其他文献
蔬菜是人类的日常食品,关系着人类的生存和健康.提高蔬菜产量和品质的重要基础是植物的生长发育.建立有效的植物生长发育模型的研究前景广阔,这不仅可用于模拟和解释植物的生
以往认知心理学认为,学生的学习主要是一种思维活动,导致教学研究只多关注学生的思维操作和思维变化,而忽视了学生身体对思维的作用。具身认知理论的发展为我们重视学生身体在学习中的作用提供了新的视角和基础。随着教育改革的逐步进展,我国关于学生学习的观念已经由知识传递转变为研究型学习、自主合作探究等。杜郎口中学自课堂教学改革以来,形成了“预习-展示-反馈”的课堂教学模式,提倡把课堂还给学生,让学生成为学习的
互联网的快速发展使我们的生活越来越丰富多彩,业务需求也越来越多样化。然而,传统的网络架构已难以满足业务多样化的需求,僵化现象也日益严重。网络虚拟化技术的出现使得僵化现象得到了很好的解决。网络虚拟化技术通过对物理网络资源进行抽象、隔离和分配,使多个虚拟网络可以共享一个或多个物理网络的资源,并且虚拟网络之间互不影响。当大规模灾难导致底层物理网络设备可靠性降低时,物理器件的损毁将造成大量的虚拟网络业务中
核电厂预应力混凝土安全壳是核岛防止核泄漏的最后一道屏障,因此安全壳的完整性和密封性非常重要。我国核电厂安全壳采用有粘结预应力系统,如果运行中发现有个别预应力钢束断
鼠害是历史悠久的全球性重要生物灾害之一,相对于传统的鼠害控制方法,不育控制因其更安全,且更为人道广泛使用,但不育剂在小肠和肝脏代谢损耗较大,若加大用量和使用频次,则会
昼夜节律(~24h)存在于大多数生物体内,并控制其生理过程.一旦昼夜节律异常,将意味着一系列疾病的发生.现在被广泛接受的是转录和翻译时滞在昼夜节律的产生中无处不在.因此,研
钢筋混凝土(Reinforced concrete,简称RC)柱是框架结构的主要抗震构件,对城镇中既有RC柱采用纤维增强复合材料(Fiber reinforced polymer,简称FRP)约束加固能满足抗震需求与安全
近年来,我国对装配式建筑的发展给予高度重视和大力支持。与此同时,钢骨混凝土由于其承载力强、延性好、刚度强等特点被广泛关注和应用。因此本文提出一种新型预制装配式钢骨
Internet上充斥着海量的信息,且在不停地增长。这些信息对不同的个体或业务有价值,有必要将大量的特定信息(数据)抓取下来,然而,这种抓取的工作可能因工作量巨大而难以手工完成。因此,有必要开发特定的工具以完成信息的爬取,这种工具即是网络爬虫工具。目前大多数网络爬虫工具需要使用者至少具备HTML、CSS等Web技术的基本知识和其他信息技术知识,具有较高的使用门槛。本课题设计和开发了一款可视化Web
自2002年加入WTO以来,中国经济同全球经济迅速融合,到2012年,处于“三期叠加”的中国经济开始步入新常态,为区别于新常态,本文将2002-2012年这段时期定义为旧常态。基于2002-2014年来自WIOD的世界投入产出表,本文首先计算了前后向系数以及国家依存度等指标,随后又从增加值角度对经济增长的动力进行结构分解,得到六个效应:增加值率变化效应、国内乘数变化效应、境内最终品变化效应、由进口