基于学习排序的即时软件缺陷预测方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:tom_7758
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网与人类生产生活之间的关系越来越密切,软件行业正处于飞速发展的时期,与此同时,软件质量的保障工作显得尤为重要。软件缺陷预测技术可以帮助软件测试人员发现软件系统中可能存在的缺陷,在早期发现并修复软件系统的缺陷可以大大节约软件开发的成本以及降低软件系统后期的维护难度。传统的软件缺陷预测一般是针对粗粒度的软件模块,如类文件,对一些复杂的软件系统来说,某一个代码源文件可能规模较大且被多人提交过,对此进行检测耗时耗力。与传统的软件缺陷预测不同的是,即时软件缺陷预测的预测对象是开发者每次提交的代码变更,在提交后可以立即检测,因此其具有细粒度和即时性的特点。本文聚焦于如何构建更好、更合理的即时软件缺陷预测模型,从两个方面展开深入研究。(1)在使用分类算法构建即时软件缺陷预测模型时,分类算法首先预测代码变更的类标号或者代码变更包含缺陷的概率,然后计算代码变更的相对缺陷密度,最后根据相对缺陷密度对代码变更进行排序。在分类模型下如何计算代码变更的相对缺陷密度,研究者们给出了三种不同的定义。为了探究哪种计算代码变更相对缺陷密度的方式更有效,以及不同的计算方式对缺陷预测模型性能有何影响,本文探究了在Out-of-sample Boot Strap采样验证、跨项目验证、对时间感知验证这三种验证方式下,三种计算相对缺陷密度方式对四种评价指标的影响。实验结果表明,第一种和第三种计算相对缺陷密度方式最为有效,第一种计算方式将相对缺陷密度表示为类标号与代码变更规模的比值,第三种计算方式在预测代码变更包含缺陷概率大于等于0.5时,将相对缺陷密度表示为包含缺陷的概率与代码变更规模的比值,在预测代码变更包含缺陷的概率小于0.5时,将相对缺陷密度表示为包含缺陷的概率减1后与代码变更规模的比值。实验结果还表明,第一种计算方式对模型的Recall@20%和Popt有利,第三种计算方式对模型的F1@20%和Precision@20%有利。(2)针对使用分类算法或回归算法构建即时软件缺陷预测模型时,可能会导致比较差的预测排名问题,本文提出一种基于学习排序的即时软件缺陷预测方法。该方法使用多目标优化算法直接优化多个代码变更的工作量感知指标,从而求得预测模型的参数解,倾向于将相对缺陷密度大的代码变更排在前列。在测试资源有限的情形下,可以使相对缺陷密度大的代码变更优先被检测。为了评估该方法性能,本文在代码变更总数为227417的6个公开项目数据集上进行实证研究,分别在Out-of-sample Boot Strap采样验证、跨项目验证、对时间感知验证这三种验证方式下,与常用的15种基准方法在指标Recall@20%、Precision@20%、F1@20%、Popt、检测出缺陷比例与检测变更比例比值上进行对比。实验结果表明,基于学习排序的方法可以达到更好的预测效果。
其他文献
海洋环境的探测与开发越来越依赖水下机器人的对周围环境的感知能力,前视声呐如同水下探测装置的一双眼睛,研究使用前视声呐对水下目标进行检测与跟踪对水下环境探测、作业有
Web和数据库搜索引擎通常根据相关性对返回查询的结果进行排序。但是,最近研究者越来越对查询的多样性感兴趣,因为多样化的查询结果可以有助于提高用户的满意度和改善用户的体验。因此,查询结果多样化在许多领域逐渐被广泛应用。首先,我们以软件系统开发过程中的服务组合为例,介绍了多样化在查询检索方面的应用。我们提出了在软件开发过程中的多样化服务组合问题,并提供了两个算法,即All-Then-Diversify
氨是重要的工业化学原材料和氢能载体,被广泛地应用于可持续性农业和能源载体生产。目前工业合成氨需要在高温高压条件下进行,造成大量能源消耗的同时释放二氧化碳,严重污染
东莞篮球中心主体育馆钢结构屋架结构设计为一种桁架、梁和悬吊屋盖的组合形式。结构跨度超过120m,外围V形柱的柱脚及柱头节点、内环上弦及下弦、跨中摇摆柱节点等关键节点设
随着我国沿海港口建设工程规模的不断扩大,吹填土的应用也越来越广泛。依据吹填土源、吹填工艺的不同,这种人工吹填土可能是较为单一的淤泥或砂,也可能是砂和黏土混合形成的砂-黏土混合物。根据混合物中砂的种类和来源不同,吹填土又可分为陆源吹填土和海源吹填土。目前,砂-黏土混合物渗透固结特性的研究多聚焦于陆源吹填土,针对海源吹填土的研究还比较少见。因此,为了满足南海岛礁建设的需求,迫切需要对海源吹填土的渗透固
实际工程中,桩基往往承受的不是单方向的荷载,而是处于一种组合的状态。在桥梁、高耸建筑、码头、钻井平台等工程中该现象尤为明显。除了竖向荷载外,车辆制动力产生的水平力及弯矩,结构偏心产生竖向力及弯矩,地震、波浪、风产生水平力及弯矩都同时作用于桩基。水平力、竖向力及弯矩共同作用下桩基受力复杂,承载特性不明确。实际设计中往往忽略了三者的组合作用影响。前人针对组合受荷桩的研究方向主要有桩基计算方法研究、桩基
本篇论文主要研究的是一维半线性抛物方程Stefan问题的边界能控性:(?)假设给定 T> 0,a(x,t)∈ W2∞((0,B)×(0,T)),a(x,t)有正下界,ax(0,t)=0,且 0 <L*<L0 <B.对任意的初值满足y0
海水淡化装置的污染和结垢问题制约着海水淡化技术的推广和发展。本文以聚醚砜(PES)和石墨烯为主要原料,制备了具有离子交换功能的磺化聚醚砜/功能化石墨烯(SPES/CSrGO)杂化膜,应
改革开放以来我国经济发展飞速,可由此带来的资源短缺、环境污染、生态退化问题十分严重,而生态环境作为一项公共产品或者公共服务,具有跨区域性质,使得跨界污染成为制约两地政府环境保护工作开展的难题和痛点,也是阻碍我国环境保护目标实现的原因之一,因为环境保护的责任很难明确界定,缺乏合理的管理监督机制,各个地区在发展经济时只考虑自己利益,轻视乃至忽视环境问题。因此深化研究环境问题的根源及变化特征,严格明确各
流行音乐即“大众的音乐”,流行歌曲是更加贴近自然、贴近大众、人们喜闻乐见且通俗易懂、常为生活中人们自娱自乐的一种真实演唱方式的音乐;中国艺术歌曲是一种声乐体裁,即带钢琴伴奏的独唱歌曲;歌剧是一种综合的艺术,是诗文、美术、色彩、音乐以声乐为主融合绽放的话剧方式,歌剧咏叹调是歌剧中的活动主体。三种艺术形式同属于声乐,但各自在发生、发展、演唱风格,以及在演唱中声音的运用等方面均有所不同。笔者曾学习演唱过