基于语义学习的二进制漏洞代码克隆检测

来源 :清华大学 | 被引量 : 0次 | 上传用户:lostsoul8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于广泛存在的代码复用和第三方开源库的使用,软件中存在着大量的相似代码段。这些原始代码片段中一旦出现漏洞,共享相似代码片段的程序将面临着很高的安全风险。现阶段的漏洞代码克隆检测研究工作普遍停留在源码级别,关于二进制漏洞代码克隆检测的研究还比较少。但由于商业版权保护等原因,很多情况下人们无法获得源代码。因而,针对二进制漏洞代码克隆检测的问题日益成为信息安全领域研究和实践工作的重点。相对于源码级别的漏洞代码克隆检测,二进制漏洞代码克隆检测面临着更加艰巨的挑战。一方面,二进制程序不易于理解,缺少变量类型、函数等大量的语义信息,导致在进行二进制漏洞代码克隆检测时,基于源码的技术无法使用。另一方面,基于文本、语法分析的精度较低,而基于语义的方法虽然可以一定程度上提高准确度,但由于该方法是基于图和树的匹配来进行,导致其检测速度很慢,难以应用于实际检测中。考虑到二进制漏洞代码克隆检测的重要性与挑战性、深度学习模型出色的学习能力,本文采用基于深度学习的方法,设计并实现了基于语义学习的二进制漏洞代码克隆检测方案。本文的主要贡献如下:1)提出“预训练+微调”的训练模式,设计并实现了一种构造大规模训练样本对的方法,解决了训练样本克隆对缺失导致模型精度低的问题。2)改进现有二进制代码语义表示方法,提出基本块特征加基于语义流图的结构化特征表示方法,通过使用更加丰富的语义信息,提高了检测精度。3)提出一种基于语义学习的二进制漏洞代码检克隆测模型,将函数语义信息融入到网络模型中,从而提高二进制漏洞代码克隆检测的精确度。最后,论文通过一系列对比实验对方案进行了验证。实验证明,本论文提出的方法具有更好的检测效果,检测结果较现有方法(如Gemini等)准确率提升约10%。此外,在保证了检测精度的同时,本文方法的检测速度仍然很快,平均约0.19s即可完成一对输入样本对的相似性检测。
其他文献
中国优秀的传统文化有很多,是中华民族源源不断的财富。优秀的中国传统文化博大精深,蕴含着极其丰富的思想智慧。儒家文化中所蕴含的体育理念,为当代初中体育教学提供了有益
在国际交易日趋复杂化的背景下,国际上已经有相当数量的国家在其立法中明确加入了商事仲裁第三人制度,以适应其国家发展的现实状况,随着商事争议的日趋复杂化,商事仲裁中相关
为提高校园足球普及水平,奠定中国足球发展的人才基础,不断丰富足球教学活动内容,强化体育课和课外锻炼,校园足球作为新课程改革之后的一种体育形式,在全国学校推行,且在全国范围内的中小学设立足球特色学校。自2015年政策颁布以来,体育传统项目学校本身就拥有自己以往的足球制度与经验,相对于2015年之后新兴起的足球特色学校足球比赛成绩更加优异。本文通过研究体育传统项目学校足球师资制度、组织管理制度、教学训
近年来,通过学者们的不懈努力,计算机视觉得到了快速发展,显著性检测也在机器学习和图像处理等领域得到了更为广泛的应用,其中包括目标识别、图像检索、图像分类、语义分割及图像问答等方面。但是,随着图像数据集的不断扩充以及场景复杂度的增加,传统的显著物体检测方法已经很难满足研究者们的需求,在许多计算机视觉任务(如边缘检测和语义分割)中难以捕获语义信息,存在很大的局限性。最近,随着深度学习技术的迅速发展,显
hERG通道是药物心脏安全性评价的重要靶点,同时还与多种肿瘤细胞的循环周期密切相关,如:结肠癌,胃癌,恶性胶质瘤和白血病。因此评价hERG通道在生物系统中的功能对了解肿瘤细胞的生理活动特点以及药物筛选具有重要的意义。目前,膜片钳技术、放射性配体标记和荧光分析法等一系列技术手段已用于hERG通道的功能评价,但是这些技术手段在高通量、灵敏度、选择性及环境友好型等方面仍然存在着缺陷,如:膜片钳技术的低通
半导体存储器是电子设备最基本的元器件之一,是现代信息技术的重要组成部分,随着互联网的迅速发展,人们对于数据的需求急剧增加,因此人们希望可以获得性能优良、价格低廉的存
公安机关侦查阶段作为证人作证的开始,在证人树立作证信心方面有着比庭审方面证人作证更为强烈和重要的意义。但目前公安机关对证人保护意识不高,力量不强,措施不多,这已影响
仿生极端润湿性功能表面在自清洁抗污耐腐蚀、油水分离材料界面净化水体、非均匀润湿性图案化表面水收集等场合具有重要的应用前景。但其现有加工方法仍存在制备过程较复杂、
协作中继系统具有诸多优势,比如提高频谱效率、降低网络成本、实现高速传输等。然而,由于移动通信的发展,现有系统的传输速率无法满足未来移动通信应用的需求。为了解决这一
关爱残疾人的身心健康是社会文明发展的重要标志,随着我国的社会发展,肢残田径运动在国际比赛中进步飞快,国家和社会各界也愈来愈重视肢残田径。如何更科学的让肢残田径运动员参与比赛,促进他们取得更好成绩,成为了我们首先要关注的问题。为能更好的了解广东省肢残田径运动员的比赛参与情况,本文通过文献资料法、问卷调查法、访谈法、实地考察法、数理统计法等研究方法,首先征询相关专家意见得到可能的影响因素,随后发放调查