基于多尺度代码度量的漏洞智能检测方法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:zxw2yanzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件的规模越来越大,软件体系结构也越来越复杂,导致软件中普遍存在安全隐患,容易受到恶意攻击。漏洞检测技术已经成为软件安全领域的研究热点,传统的漏洞检测方法大多依赖专家给出的安全缺陷规则和人工定义的漏洞特征。但随着软件系统规模的增加以及变化多样的新型漏洞的出现,不仅人工成本过高,专家在定义规则和特征时的主观性也会影响误报率与漏报率。随着人工智能技术的兴起,鉴于机器学习和深度学习具有较强的大数据表征能力,大量基于人工智能的漏洞检测研究应运而生。然而,现存的研究方法大多没有考虑多维度的表征方式,导致面向源代码的检测过程中存在信息缺失等问题。为了解决以上问题,本文提出了一种基于多尺度代码度量的漏洞智能检测方法(Scalable Vulnerability Detection Method,SVDM),具体研究内容如下:(1)针对当前代码表征的语义信息不丰富问题,本文引入函数粒度、行粒度代码度量和语义度量,构建了多尺度代码度量对源代码进行表征。首先通过预处理将源代码处理为代码切片,通过连续词袋技术将代码切片转换为一维特征序列,并将其作为语义度量;其次,通过计算和统计代码切片中的文本度量和复杂度度量,分别构建函数粒度代码度量和行粒度代码度量。这种多尺度的代码表征方式在提取源代码上下文语义信息的同时,也兼顾了文本的复杂度、文本特征等度量,为基于深度学习的漏洞检测方法提供了大量可靠的代码表征。(2)受到图像处理领域中特征金字塔(Feature Pyramid Network,FPN)的启发,本文设计了一种用于漏洞特征抽取的多尺度特征网络(Scalable Feature Network,SFN)。SFN是由一层双向长短期记忆网络(Bi-LSTM)和两层卷积神经网络(Convolutional Neural Networks,CNN)构造的三层纵向特征抽取网络,其中Bi-LSTM特征抽取层将多尺度代码度量中的语义度量作为输入,两层CNN特征抽取层分别将函数粒度度量和行粒度度量作为输入。这种一一对应的网络模型保证了源代码的特征信息能够完整的转化为特征向量,此外还通过特征融合技术将不同尺度的特征向量拼接,用于改善检测模型对漏洞特征的感知能力,提高检测模型的效果。(3)本文设计并实现了一个基于Bi-LSTM的漏洞表征学习网络模型。该模型包括输入层、Bi-LSTM层、稠密层和输出层,其中输入层将多尺度特征网络得到的特征向量作为训练数据,依靠Bi-LSTM优秀的时间序列处理能力,对特征向量进行表征学习以获得源代码高层语义特征,同时也缓解了梯度消失以及长期依赖信息能力差等问题。稠密层对Bi-LSTM层的输出进行降维,并通过Softmax逻辑回归模型将检测结果归一化,并对学习到的特征进行分类从而达到漏洞检测的目的。最后,本文所提出的SVDM模型针对包含CWE-119和CWE-399两种漏洞类型的数据集(Multi-SET)进行了试验。实验结果表明,SVDM在Multi-SET数据集上整体的精确率和召回率分别达到了84.3%和83.4%,并且假阴性率和假阳性率分别降低至16.6%和15.7%。与其他现有的数据集和漏洞检测方法相比,本文所构造的多尺度代码度量有更全面的表征能力,同时SVDM具有更高的精确率和更低的误报率。
其他文献
本研究选择二硫化钼(MoS2)对两种金属-有机骨架材料进行改性,以提高其可见光催化活性。同时利用棉织物的强吸附、高比表面积和低成本等优点作为粉末光催化剂的载体,解决了粉末光催化剂难回收、循环性差等问题。(1)通过MoS2的改性处理,提出了一种制备高效、耐用和可回收的分子筛-咪唑骨架-8(ZIF-8)基光催化材料的新策略。在羧基棉织物(Carboxyl cotton)上通过层层自组装制备ZIF-8,
利益平衡是版权(著作权)乃至整个知识产权制度的基石。其在数字音乐的版权性上,体现为权利保护与限制之间的平衡;在"独家授权"到"全面授权"的模式选择上,体现为私益与公益之间的平衡;在法律规制上,体现为不同法益之间的平衡。这种利益平衡在本次新修改施行的《著作权法》中得到了不同程度的体现。数字音乐版权在立法、司法、执法上的适度保护与限制,需要不断地寻找新的利益"平衡点"。
现代社会经济不断发展,随着人们生活水平逐渐提高,对生态文明建设也重视起来。国家对于林业生态环境建设也给予了最大的重视与关注,如何加强森林中的病虫害防治工作已成为当下社会热门问题。森林是国家乃至整个地球十分重要的生态资源,与人们的生活质量和经济利益息息相关,保护林业生态就是保护人类自己。针对吉林省双辽市国有林场的林业生态环境建设需要从长计议,着力于当前实际情况。以森林病虫害的防治工作为切入点,研究出
<正>2022年国务院印发《关于中央企业加快建设世界一流财务管理体系的指导意见》明确指出:国有企业应“积极探索依托财务共享实现财务数字化转型的有效路径,推进共享模式、流程和技术创新,从核算共享向多领域共享延伸,从账务集中处理向企业数据中心演进,不断提高共享效率、拓展共享边界”。本文基于国务院推进核算共享向多领域共享延伸,
期刊
电视纪录片在我国广播电视史中一直占据着重要的地位,我国电视创办初期最主要的两种节目类型就是纪录片和新闻片。直到今天,电视纪录片仍是衡量电视台水平的标准之一。近年来,各种各样的电视节目层出不穷,电视新闻类节目仍占据着电视的主导地位,而电视纪录片却一步步消退,逐渐陷入边缘化的危机中,同时,纪录片的收视率也不太乐观,因此当前电视纪录片的生存问题受到广泛关注。现就电视纪录片栏目的发展趋势进行了研究。
期刊
目的 探讨正常孕妇妊娠中晚期血脂水平与巨大儿发生风险的关系。方法 选取2020年9~12月在中国福利会国际和平妇幼保健院定期产检的无高危风险健康孕妇作为研究对象进行回顾性研究,根据新生儿出生体重分为巨大儿组(94例)和对照组(259例)。比较妊娠中晚期两组一般资料及血清总胆固醇(total cholesterol, TC),甘油三酯(triglycerides, TG),低密度脂蛋白(low de
论文以20家医药上市企业为研究样本,通过因子分析法对其2020年和2021年重要财务指标进行分析研究,识别影响医药上市企业绩效的主要财务指标,并据此构建财务绩效评价模型。通过分析2020年和2021年排名前六的医药上市企业和排名上升幅度较大企业的主营业务,来为医药上市企业未来发展提供决策建议。
目的:研究NLRP3炎症小体小分子抑制剂MCC950在蛋氨酸胆碱缺乏(MCD)饲料诱导小鼠非酒精性脂肪性肝类(NASH)形成中的作用及分子机制。方法:C57BL/6小鼠用MCD饲料喂养4周的方式构建小鼠NASH模型。将实验分为Control组、单纯MCD饲养组(MCD组)以及MCD饲养且每隔2周经腹腔注射50 mg/kg的MCC950(MCC950组),4周后,测量各组小鼠及小鼠肝脏的质量,HE染
近年来,由于超疏水材料在防污自清洁、减阻、油水分离等方面表现出潜在的应用价值,并对在生物、医学、工业等领域具有重要的研究意义,超疏水材料已成为研究人员所关注的热点。但由于其独特的表面结构与化学组成,使其存在耐久性差、机械性能差、含氟等问题,难以满足实际需求。为了制备出长效耐久的超疏水材料,本课题采用热稳定性好、耐候性强、硬度高且对环境友好的有机硅树脂和丙烯酸树脂作为原料,然后通过化学键接枝的方法将
当今社会化石燃料枯竭和环境污染问题愈加严峻,为响应“碳减排、碳中和”的号召,储存和利用可持续发展的清洁能源已迫在眉睫。氧析出反应(OER)和氧还原反应(ORR)构成了许多重要的能量储存或转换技术的核心过程。贵金属催化剂性能极佳,但由于其价格贵、储量低,实际应用受到极大限制。因此开发低成本、储量高、性能好且稳定性强的电催化剂十分重要。以碳基材料为基础的改性催化剂不仅具有高的导电性和强的电子传输能力,