基于图神经网络的源代码漏洞检测方法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:liongliong589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的发展,软件技术的应用越来越普遍,对相应软件的漏洞检测要求高效、准确。然而,软件漏洞是多种多样的,通过源代码检测漏洞对开发人员的专业经验要求很高。以往的漏洞检测方案要么依赖专家定义的特征,要么只对代码序列使用递归神经网络,很难在传统的代码空间中提取复杂的漏洞特征。近年来,随着人工智能技术的蓬勃发展,一些学者开始尝试提取源代码的抽象表示图,结合图神经网络用于软件漏洞检测,但目前此类研究工作仍处于探索阶段。在此背景下,本文对基于图神经网络的源代码漏洞检测工作展开了研究。本文所做的主要工作如下:首先,提出了拓展代码属性图(Expansion Code Property Graph,ECPG),并引入傅里叶变化关注到更多有效的节点特征信息。本文在Yamaguchi[18]等人提出的代码属性图上添加了三种边类型,关注到了变量使用先后关系、条件表达式内部语句顺序关系等与漏洞有关的语义信息,构建了拓展代码属性图。在ECPG的基础上,本文引入傅里叶变换对图中节点的初始特征向量进行特征提取,该初始特征向量通过Wrod2Vec编码获得。通过实验证明,傅里叶变换操作为漏洞检测带来了不错的效果提升。其次,基于拓展代码属性图,引入了当前在图分类任务上表现优秀的图同构网络(GIN)。在其模型的基础上,为了有效的利用所有深度的全局信息,本文通过结合自注意力机制改进了图读出的聚合操作,提出了基于自注意力机制读出信息的图同构网络(SAR-GIN)模型。通过实验证明,本文提出的SAR-GIN具有良好的漏洞检测能力,且拥有比GIN模型更好的效果。再次,受SAR-GIN的启发,本文对其他漏洞检测工作中使用到的图卷积神经网络(GCN)也进行了相似的改进,提出了基于自注意力机制读出信息的图卷积神经网络(SAR-GCN)模型。通过实验证明,SAR-GCN拥有比GCN更好的漏洞检测能力。最后,为了综合利用本文提出的两种模型,进一步提升源代码漏洞检测的效果,本文提出了基于SAR-GIN和SAR-GCN的集成模型IVD(Integrated Vulnerability Detection)。通过实验证明,IVD模型具有比单一模型更好的检测效果。使用论文[28]提供的数据集,对本文提出的IVD方法进行了测试,与其他三个基础模型,两款开源的静态代码扫描工具以及现有的一些基于深度学习的检测方法进行了对比。实验结果证明,IVD方法综合表现优于其他模型,可以有效应用于源代码漏洞检测中。
其他文献
近似最近邻搜索是信息检索技术中的一个基本课题,在数据库、推荐系统等领域应用广泛。与精确最近邻搜索算法相比,近似最近邻搜索算法内存占用较小,同时牺牲较小的查询召回率,从而达到极快的查询速度。基于图的近似最近邻搜索算法是最常用的近似最近邻搜索算法之一,相对于基于空间划分、基于哈希和基于量化的算法,因其查询速度快、查询召回率高而被各大商业公司广泛应用。基于图的搜索算法的目标是构建高质量的图索引结构,通过
学位
人工智能模型的训练依赖于大规模高质量的标注数据。通过人工标注的方式可以获取高质量的训练集,但是人工标注效率很低并且代价高昂,尤其对于标注难度较大的文本语料,人工标注很难获取大规模的标注数据。远程监督可以用来自动构建大规模的标注数据集,然而通过远程监督得到的训练集质量并不高,训练集的质量决定着模型的上限,因此如何优化远程监督数据集已经成为当下研究的热点。远程监督在不同场景下面临着不同的问题,其解决方
学位
针对永磁同步电机在弱磁运行过程中因参数变化导致的控制性能下降问题,提出了一种采用单q轴电流调节器的多参数自适应补偿控制策略,以提高电机在弱磁区域内的转矩控制精度。实验结果表明该方法对参数的辨识误差在5%以下,输出转矩与期望转矩的误差小于1%,该方法能有效地抑制多参数变化对电机性能的影响。
期刊
随着无线传能技术的快速发展和无人机在各个领域的广泛应用,利用微波无线传能为飞行中的无人机提供能量保障已成为延长无人机工作时间的有效途径。考虑到微波点对点直接传能在无人机供电方面存在局限性,本文针对面向无人机供电的微波无线传能链路进行建模与优化研究以在一定程度上提高无人机微波无线供电的环境适应性、传输效率和实际应用价值。首先,本文对微波无线电能传输技术原理及其在无人机供电上的应用进行分析,针对面向无
学位
面部表情是人类情感信息传达的重要载体,在人们的沟通交流中发挥着重要作用。随着人工智能的迅速发展,让机器理解人类的情感具有重要的研究意义和实际应用价值。依托课题组视频动作识别与智能分析项目,本文研究基于卷积神经网络的人脸表情识别方法,并应用于课堂教学表情识别系统,协助教师对学生学习状态进行实时了解和事后分析,从而帮助提升教师教学质量。本文的主要研究内容如下:(1)针对轻量级网络Mobile Net
学位
近些年,无人机的广泛应用对空域资源提出了更多的需求,无人机的运行空间将逐步由隔离空域向融合空域扩展,保证飞行安全是将无人机集成到国家空域管理系统的前提。感知与规避(Sense and Avoid,SAA)是实现无人机自主飞行安全的关键技术,设计无人机感知与规避系统时,如何配置和融合使用感知传感器是无人机实现空域信息获取的重要环节。本文首先研究了针对不同任务环境的无人机SAA系统的感知传感器配置算法
学位
人们在浏览电商网站或购物软件上的服装产品时,往往会产生多样化的检索需求,如希望找到在某些服装属性上与查询图片相似的服装,以及希望改变查询图像某一服装属性而保持其它服装属性不变的需求,即服装属性操作,这些需求即为细粒度服装图像检索,当前的搜索引擎对这些需求还无法很好的满足。针对以上的检索需求,需要提取图像与服装特定属性准确相关的特征,深度学习的发展使得这一操作成为可能,本文基于深度学习理论深入研究了
学位
关系抽取意在抽取文本中实体对的关系,对于知识图谱的构建起着重要作用,是自然语言处理中重要任务之一。关系抽取面临着诸多挑战,尤其是复杂语境和学习能力带来的文档级关系抽取以及少样本关系抽取问题。本文重点研究了针对上面两个问题现阶段的工作以及存在的不足并进行了相应的改进。我们发现以下几个不可忽视的问题:1)现阶段的文档级关系抽取模型一般只从单方面捕获信息;2)文档级关系抽取模型或者是依赖于外部解析器构造
学位
针对城市轨道交通X射线安检危险品识别,在YOLOv5m基础上,增加了CBAM注意力,分别对通道和空间的特征进行操作。经过实验验证,该方法的mAP50:95、mAP50分别提升了0.6和1个百分点,结果表明改进后的算法能显著提高检测精度。
期刊
近年来,在三维视觉感知技术的推动下,新型智能机器人逐渐具备了越来越强大的感知和交互能力。基于视觉感知的机器人抓取技术主要分为已知目标物体模型的抓取和未知目标物体模型的抓取。对于未知目标物体模型的视觉抓取,抓取算法需要尽可能地感知物体的完整信息。然而,受到物体遮挡和扫描误差的影响,单帧RGB-D图像中包含的物体信息往往不够完整并且存在一定的噪声,这给机器人的精准抓取带来了一定的挑战。而对于模型已知的
学位