基于缺陷报告和源代码的相似缺陷识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:huang267321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着软件技术的蓬勃发展,软件系统及开发团队的规模也随之迅速增长,开发人员得到的待修复缺陷报告数量也成倍增加,加之开发人员很难完全了解整个软件系统的全部代码文件,因此,提高缺陷报告的分派效率以及定位待修正的代码文件,以此提高修复缺陷的效率是当前亟待解决的问题。缺陷报告与代码文件之间存在语义失配的问题,因此缺陷报告与代码文件的匹配方法是当前的一个难点。现有的研究中仅基于缺陷报告与代码文件之间匹配程度直接计算其相关度,并基于该相关度对所有代码文件排序,为该待修复缺陷报告推荐排名靠前的代码文件。然而,若能识别出与新的待修复缺陷报告相似的缺陷报告集合,则对修复缺陷的方法以及修复者指派提供指导性意见;识别相似的代码文件对修复相似的缺陷也有着重要意义,另外对于大型的软件项目,从投入使用到维护阶段,其历史缺陷报告及历史代码文件也会越来越多,其中可用的信息也会越来越多。因此本文基于挖掘这些可用信息提高为缺陷报告匹配代码文件的准确率。具体来说,针对以上的问题,本文的主要工作如下:首先,相似缺陷报告对于修复新的缺陷报告具有一定的指导性,因此,本文提出一种基于动宾短语和主题模型的相似缺陷报告识别方法。该方法除了利用通常使用的向量空间模型方法表示文本信息外,通过句法分析提取缺陷报告的结构化信息作为衡量报告间相似度的重要依据。其次,针对缺陷报告与代码文件之间存在语义失配的问题,本文利用相似缺陷报告识别,完善现有为缺陷报告定位待修复代码文件的方法。该方法与现有的研究相比,考虑了历史缺陷报告集合对修复当前缺陷的指导性,以此提高现有方法的召回率,从而提高软件修复的效率。最后,基于当前相似代码检测方法研究现状,为了提高现有方法的实用性,本文改进了现有的相似代码检测方法的向量特征构建方法,考虑程序容量对实验结果的影响,提高现有方法的准确度,并使用抽象语法树的层次化结构以及局部敏感哈希算法降低计算复杂度。此外,还验证了该方法在不同高级程序语言中的实用性。
其他文献
自住房制度改革以来,我国房地产行业取得了高速发展,现已成为我国经济的重要支柱性产业,在扩大内需、拉动经济、增加就业等方面发挥着重大作用。银行业金融机构能否做好房地产信贷风险管理,既关系到银行自身的信贷资产安全,又关系到整个房地产市场和金融市场的稳定,具有重要的现实意义。2020年,为增强银行业金融机构抵御房地产市场波动的能力,防范金融体系对房地产贷款过度集中带来的潜在系统性金融风险,提高金融机构稳
学位
随着我国经济发展和人民生活水平提高,人们对艺术教育的追求越来越强烈,幼儿舞蹈教育作为艺术教育的重要组成部分也受到越来越多的重视,诸多专家笔者开始对一线教师的幼儿舞蹈教学方法展开研究,提倡对传统的教学方法进行创新变革。本文对以绘本为载体的幼儿园舞蹈教学活动进行行动研究,初步尝试将绘本和幼儿园舞蹈教学有机融合起来。首先阐明幼儿园舞蹈教学活动对幼儿身心健康发展所起到的至关重要作用,但是目前绘本在幼儿园舞
学位
托卡马克装置是目前世界上被公认最有可能实现磁约束核聚变的装置,未来极有可能用此装置实现聚变能发电。其中核聚变装置中最为重要的部件之一是包层系统,包层系统是核聚变装
传统的小规模数据处理方法已经很难满足海量数据处理的技术要求,因此,围绕着大数据的新型数据处理技术接踵而至。并行计算作为大数据处理中重要的技术之一,可以极大地缩减程
随着我国电子信息产业的不断发展,数字信号处理器(DSP)在航天、通信、工业控制等领域获得了极为广泛的应用,DSP会朝着高性能、低功耗、拓展多种应用的方向迈进。中断系统作为
核磁共振成像是现阶段重要的临床医学成像方式之一,因其对患者诊断的精确性以及对人体无伤害性等优势,而得到广泛应用。然而,较长的数据采集时间是影响磁共振成像进一步发展
施肥施药是农业生产中的重要环节,目前我国的施肥施药机具存在作业精度差、肥药利用率低、作业效率低下和功能单一等问题,难以满足农业现代化需要。针对现存问题,本文提出一种将施肥与施药相结合的复式作业方式,设计了大宽幅对行施肥施药车,适用于行播作物的施肥施药,并试制了样机,进行了田间试验。(1)完成了大宽幅对行施肥施药车整机结构与关键部件设计,确定了施肥施药车的作业幅宽拓展、对行距离调节、作业高度调节、机
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术凭借其在频谱效率、能量效率和鲁棒性方面的明显优势而在无线通信领域被广泛使用。在实际的通信系统中,大规模
异构网(Heterogeneous Network,Het Nets)是5G的关键技术之一,提高了网络容量和数据速率,解决了传统小区覆盖盲区的问题,但是愈加复杂的干扰问题也随之而来,这会导致系统的性
图像恢复问题是数字图像处理中的一项重要研究内容,而彩色图像恢复问题又是图像恢复中的一个重要分支。彩色图像在计算机中,不同于二维的灰度图像,是具有三通道结构的图像,因