基于SHAP分析的即时软件缺陷预测模型

来源 :上海应用技术大学 | 被引量 : 0次 | 上传用户:zhjipi07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件测试保证了高质量软件产品的交付,而软件缺陷预测已经成为软件测试的一个重要部分。软件缺陷预测分为传统软件缺陷预测,以及即时软件缺陷预测(JIT-SDP)。即时软件缺陷预测是保障软件安全与质量相统一的必要途径,在软件工程领域受到越来越多的关注。然而,现有数据集存在特征冗余和特征相关性低的情况,极大影响了即时软件缺陷预测模型的分类性能和稳定性。此外,分析缺陷数据特征对模型的影响尤为重要,但如今对软件缺陷预测模型进行解释性研究较少。再者大多数现有的软件缺陷预测框架都较为单一,这使得为开发人员提供更详细的参考信息变得极其困难。本文为了提升软件缺陷预测效果,从而实现有效的软件测试资源分配。针对这些问题,论文的主要工作如下:首先,创新性地选择了SHAP+SMOTEENN+XGBoost(SHAP-SEBoost)构建即时软件缺陷预测模型。首先通过SHAP(SHapley Additive ex Planation)模型可解释器分析初始数据集特征,并根据分析结果对数据集进行相应的特征选择与组合。然后,利用SMOTEENN对类不平衡的缺陷数据进行正负样本均衡化,使用集成学习算法XGBoost对实验数据进行预测建模。最后,使用SHAP对本章模型进行可解释性分析。其次,提出一种基于Nested-Stacking和异构特征选择的软件缺陷预测框架。该框架包括数据集预处理以及特征选择、Nested-Stacking分类器和模型分类性能评估三个阶段。框架中的异构特征选择和嵌套自定义分类器,能够有效提升软件缺陷预测的准确性。最后,本文在两种软件缺陷数据集(Kamei、PROMISE)上进行实验,通过AUC和F1-score两种综合性评价指标来展示模型分类性能。实验进行了大规模的同项目内预测和跨项目预测。结果表明,本文提出的框架在两类软件缺陷数据集上均具有良好的分类性能,与基线模型效果相比得到了较大提升。
其他文献
<正>天津凭栏文学社成立于天津市静海区大邱庄镇大屯学校,现已成为面向全区初中师生的公益性大型文学社团组织,聚拢了大批热爱文学的师生。文学社致力于学生核心素养的自然生成,活动以阅读为抓手、习作为手段、报刊发表为激励,培养学生的读写兴趣,提高学生交流、表达、鉴赏、思辨能力,进一步发掘学生的写作潜能,引导学生向文学最深处漫溯。近年来,师生在《语文报》《好作文》《语言文字报》《中国家庭报》等报刊发表作品1
期刊
显著性目标检测的目的是找出图像中最引人注目、信息量最大的区域或目标。它可以作为图像分割、视频追踪等计算机视觉应用的预处理步骤来提高任务的性能。过去,传统方法利用手工制作的视觉特征(如颜色、纹理和对比度等)从输入的图像中检测出显著目标。然而,由于缺乏高层次的语义信息,传统方法在面对复杂场景时的检测性能一般。受益于深度学习技术的发展,基于卷积神经网络的显著性目标检测方法在性能上获得了大幅提高。如今,大
学位
近年来,随着国内外信息技术产业的不断发展,人类社会生产信息的能力大大增强,导致人们迫切需要能够对信息进行高效处理与筛选,这就需要使用自然语言处理领域的文本自动摘要技术帮助人们将大段文本内容整理成保留关键信息的精炼内容。本文针对科研论文这一具体领域的文本,将编码成知识图谱形式的科技论文进行摘要生成研究,提高了科技论文摘要文本生成的质量,从而使科研工作者的工作效率得以提高。本文的主要工作内容如下:1.
学位
人群计数是一个经典的计算机视觉任务,其主要任务是设计算法自动统计出给定图像的人数,对公共安全领域有着重要的应用意义与价值。其中密集人群计数任务中由于存在场景中人数多、人头尺度变化剧烈等挑战,引起了研究者广泛的兴趣。但当前人群计数算法面对密集人群场景并不能取得令人满意的结果,原因在于一些方法没有利用多尺度信息,而多尺度特征被证实在各种视觉任务中都十分重要,其次,一些利用了多尺度信息的方法也由于参数的
学位
即时软件缺陷预测是一种细粒度的软件缺陷预测技术,它能识别出软件系统中有缺陷的代码变更,从而帮助开发人员迅速地发现引起缺陷的原因。工作量感知的即时软件缺陷预测是一种考虑到代码检查成本的缺陷预测技术,其目标是在有限的测试资源中检测更多的有缺陷的代码变更。传统的工作量感知即时软件缺陷预测模型主要基于代码行数(Lines of code,LOC)来衡量工作量,很少考虑其他因素,因而不能准确地度量工作量。另
学位
回环检测是SLAM中的一个重要组成部分,它可以有效降低机器人运动过程中的累积误差。现存的回环检测方法主要是在机器人运动轨迹内均分累积误差,而实际机器人的运动误差与其运动速度和转角有关,机器人修正后的运动轨迹难以与真实的运动轨迹相吻合。本文在分析机器人运动误差产生机理的基础上,提出一种新颖的基于微分流形的回环检测方法,主要包括机器人运动中的关键帧提取方法研究及基于微分流形的机器人光滑运动轨迹模型。具
学位
<正>借助几何直观促进数学问题解决是培养学生核心素养的重要手段。教授图形公式可以鼓励学生借助几何直观合理猜想,并加以论证;数学问题条件繁杂时,为了理清数量关系,我们不妨画一个思维导图;易错应用题仅凭想象容易理解错误,指导学生画图再解答,会有效绕过易错障碍。教师应从低年级就有意识地培养学生几何直观意识,课堂留出足够的时间让学生的直观意识自然生发,向思维更深处漫溯。我国著名数学家华罗庚曾说过,"数
期刊
固体氧化物燃料电池(SOFC)具有发电效率高、无环境污染、可适用多种燃料等优点,在多个领域有着广泛的应用。固体电解质作为SOFC的核心部件,在SOFC中发挥着重要作用。氧化钇稳定的氧化锆(YSZ)电解质难以满足中温SOFC的使用要求,开发在中温(500~700℃)下具有高离子电导率的新型电解质材料是降低SOFC工作温度的关键因素之一。掺杂的氧化铈基电解质材料在中温下具有比YSZ更高的电导率。然而,
学位
本文针对如今市面上微力传感器无法进行多维多自由度测量的问题,设计了一种基于微机电系统(MEMS)的压阻式多自由度微力传感器。设计的MEMS多维微压阻式力-力矩传感器可以在微力检测的同时,对X、Y、Z三轴的力-力矩同时检测。该传感器为未来在触觉传感、智能检测方面提供了理论指导和实验验证。本文的主要研究内容如下:(1)首先基于MEMS微细加工技术,设计了十字悬臂梁形微压阻式力传感器,该结构可以很好的对
学位
直接甲醇燃料电池(DMFC)由于其甲醇来源丰富、能量密度高、无污染和操作方便等优点备受关注。阳极催化剂的活性和稳定性是决定DMFC性能、寿命和成本的关键。然而,催化剂活性组分Pt的价格昂贵和易中毒等缺点限制了DMFC的应用。本文主要制备了Pt/g-C3N4-CNS催化材料,针对Pt/C催化剂存在的问题进行了改性与优化。首先利用水热法形成的一系列g-C3N4-CNS(g-C3N4和碳纳米片)复合载体
学位