Bug报告的相关源代码文件定位

来源 :南京大学 | 被引量 : 0次 | 上传用户:leegimars
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在软件开发过程中,每收到一个bug报告,开发人员通常需要花费大量的时间和精力来找出bug可能发生的位置。近年来,为了减轻开发人员的负担,学者们提出了一些自动化的基于信息检索或机器学习的bug定位方法。然而我们发现学者们在评价他们所提出的bug定位方法时使用的评价指标都是序列位置相关的,并没有考虑不同大小的源代码文件所需的审查工作量并不一样的问题,也即这些评价指标并不能说明bug定位方法是否能有效减少开发人员检测出与bug报告相关的源代码文件所需的工作量。为探明利用bug报告进行bug定位的方法在工作量感知的评价指标下的性能,本文实现了包括近年来具有代表性的Learning to Rank(LR)和BugLocator方法、经典的 VectorSpace Model(VSM)方法以及朴素的 Usual Suspects(US)方法在内的四种bug定位方法,并提出六个工作量感知的评价指标,最后在六个Java开源系统上进行实验,结果表明:(1)对于大多数系统,在对定位结果中的前k个文件进行审查时,LR方法所需的工作量比BugLocator方法和VSM方法更多,同时LR方法的工作量精度更低;(2)对于大多数系统,从定位结果中找出所有的或者第一个与bug报告相关的源代码文件时,LR方法所需的工作量比BugLocator和VSM方法多,同时尽管LR方法拥有较高的工作量精度,LR方法的性能仍有较大的提升空间;(3)LR和BugLocator等复杂的bug定位方法在工作量感知的评价指标上的表现并不优秀。由于之前的研究表明在使用序列相关的评价指标对LR方法、BugLocator方法、VSM方法以及US方法进行评价时LR方法的性能比另外三个方法的性能都要优秀,因此本文的实验结果证实了基于序列位置的评价指标不能准确地反映一个bug定位方法的性能,在对基于信息检索或机器学习的bug定位方法进行评价时需要考虑源代码审查工作量对bug定位方法性能的影响。
其他文献
作为一种语言现象,连动式广泛地存在于世界上多种语言当中。正是因为其普遍性的特点,吸引了众多学者的关注,其研究史也超过了百年。然而,国外有关连动式的研究,从研究的语言来说,大
果蔬运输振动是造成果蔬机械损伤的重要原因。目前,模拟运输是研究果蔬振动损伤的主要方法。将果蔬品质评价指标与振动相关参数建立联系,检验其相关性,得到最优果蔬品质评价
三元流闭式叶轮零件强度、刚性好,工作效率、可靠性高,越来越多应用于航空航天及先进透平机械领域。但是,三元流闭式叶轮结构复杂、可加工性差,且有些零件采用难切削材料,其整体制
目的:探讨改良双钢板内固定、锁定钢板内固定、外固定架结合有限内固定三种手术方法治疗复杂胫骨平台骨折的适应症及其临床疗效,为临床上选择合适的治疗方法提供理论依据。材料
目的探讨选择性脾动脉栓塞治疗脾破裂的临床疗效。方法对18例单纯性脾破裂患者均采取Seldinger法穿刺股动脉后选择性或超选择性插管脾动脉造影,查找出血部位,用栓塞剂栓塞出
目的探讨无创正压通气在慢性阻塞性肺疾病(COPD)合并II型呼吸衰竭的治疗效果。方法将60例COPD合并II型呼吸衰竭患者随机分为治疗组和对照组各30例,所有患者均给予鼻导管吸氧
应急门是飞机结构中的一个重要部件,对于大型客机的结构、功能的完整性和安全生产具有重要的意义。本文即利用虚拟样机技术,在多体动力学仿真软件ADAMS中,建立起了某大型客机右(
本文依托花天河大桥为背景工程,采用Midas/FEA与Midas/Civil对连续刚构桥进行全桥施工阶段剪力滞效应分析。大跨径连续刚构桥在施工全过程中,主梁截面应力是一个不断变化的过程
人类白细胞抗原(HLA)是最早发现的与疾病有明确关系的遗传系统,具有多态性、多基因性及高度特异性。作为调节机体免疫应答的重要基因群,它与疾病的免疫应答密切相关,并在抗原识别
[目的]通过实验研究观察千金藤素(Cepharanthine,CEP)对人结肠癌的抗增殖作用。[方法]本研究通过活体荧光示踪技术研究CEP对人结肠癌细胞HCT116裸鼠异体移植肿瘤模型的抗结肠