基于文本分析的软件缺陷定位模型研究及应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:wenzi555888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代计算机软件的快速发展,系统研制已经由传统面向硬件的研制与集成,转变为以大量软件开发与集成为主。软件系统内在规模和复杂性不断提高,引发了大量复杂缺陷的产生,从而软件测试成为了系统质量保障的关键。软件缺陷定位是软件测试中一项重要的软件维护行为,如何尽早的定位缺陷是软件工程一个重点研究方向。本文研究内容主要包括以下方面:首先,针对现有的软件缺陷定位存在缺陷报告中的自然语言和源文件中的编程语言的词汇不匹配问题,提出了一种基于信息检索和词嵌入的缺陷定位方法。该方法通过信息检索技术来收集缺陷报告和源文件之间的精确匹配,通过词嵌入技术将缺陷报告中的术语与源文件中潜在的代码令牌进行关联。实验结果表明该方法考虑了源文件与缺陷报告的文本和语义相关性,实现了信息检索与词嵌入技术的优劣互补,提高了软件缺陷定位的准确性。其次,针对现有的软件缺陷定位将源文件视为自然语言进行处理会导致源文件语法和结构信息丢失的问题,提出一种基于语义和语法的源文件特征向量表示方法。根据抽象语法树中不同的节点类型对程序语句进行分析,利用词法和句法信息构建递归编码器得到每个语句的特征向量。根据源码的顺序自然性,使用LSTM生成源文件的特征向量表示。然后将该方法应用于软件缺陷定位中,以及在以上提出的基于信息检索和词嵌入的缺陷定位方法的基础上,提出一个基于源文件语义和语法信息的缺陷定位模型。从文本、语义和语法三个方面综合地分析源文件与缺陷报告的相关性,从而定位含有缺陷的源文件。实验结果表明该缺陷定位模型与其他同类方法相比得到的结果准确度和可靠性更高。最后,综上所述提出一种基于文本分析的软件缺陷定位模型,对缺陷进行记录形成缺陷报告,从源文件与缺陷报告的特征提取、源文件的特征向量表示到相似度计算与集成,实现缺陷定位。将该模型应用于一体化舰艇作战系统的软件测试过程中,为软件开发和维护人员缺陷定位提供指导。同时设计并实现了缺陷定位系统,包括需求分析、总体设计、功能设计以及关键技术实现等,验证了基于信息检索和词嵌入的缺陷定位方法和基于语义和语法的源文件特征向量表示方法的实用性和有效性。
其他文献
目前,随着深度学习的发展和单幅图像去雨技术的提高,基于深度学习的图像去雨技术在如户外场景监控,自动驾驶技术和无人机系统等场景有着非常广泛的应用前景。目前针对单幅图像去雨的算法可以分为基于先验性知识的图像去雨算法和基于深度学习的图像去雨算法。基于先验性知识的图像去雨算法借助雨纹中的先验性知识,采取优化的方法来去除图像中的雨纹。此类算法可以去除图像中较为稀疏的雨纹,但无法去除大且密集的雨纹。基于深度学
学位
随着我国高速铁路建设的快速发展,建成了较多高铁客运站站前广场及配套设施,作为中途站和连接站的中小型高铁站虽然数量众多,却因规模尺度有限,在规划设计中存在较多问题。通过对延平西站站前广场及配套设施总体规划布局存在的问题进行分析,充分考虑各种交通出行方式,提出基于布局集约化、交通一体化的总体设计方案。项目建成后运营状况良好,受到当地社会的一致好评,为类似工程项目提供一定的借鉴。
期刊
机器学习虽然在许多领域中广泛应用,并在大多数情况下表现优异。然而,某些情况中的数据含有的噪声和不确定性会大大影响算法的性能。因此,降低以及消除这些因素的影响是十分重要的。同时,模糊理论能够很好处理数据中的噪声或不确定性,本文利用模糊理论改进了CVM以及CNN,以提升这两种算法处理含噪声或者不确定性数据时的表现,主要工作如下:1.针对网络入侵检测数据中的噪声问题,FSVM在SVM的优化问题的目标函数
学位
随着无人机技术逐步提高以及制造成本逐年降低,它目前被广泛应用于诸多生产生活领域,在创造出巨大的社会价值的同时,也提高了公共安全、空域交通等诸多层面的维护和管理难度。因此,必须通过引入自动化技术来降低无人机检测的人力成本,在确保空防安全的同时,提高安防管理效率。目前基于计算机视觉的目标检测方法具有可视化效果好、易于集成部署、适用场景丰富等优点,故本文主要针对基于计算机视觉的无人机小目标检测技术进行深
学位
为了提升频谱资源的利用率以缓解其稀缺现状,有不少基于集中式数据库的动态频谱共享系统方案被提出。然而,集中式体系结构通常被认为是不透明的且更容易受到攻击。基于区块链技术的分布式体系结构具有去中心化、开放、透明、防篡改和可审计等优点。考虑到在频谱共享中引入区块链技术也可能会带来隐私问题,本文设计了一种隐私保护的双拍卖机制来保护用户的隐私信息同时还能够合理地配置资源。本文利用区块链运行上的智能合约来实现
学位
近年来,凭借着体积小、发光效率高以及工作寿命长等特点,LED灯正逐渐取代白炽灯与荧光灯成为主流的照明灯具。随着LED的大规模部署,以LED光源作为信号发射机的可见光通信技术开始受到产业界与学术界的广泛关注。可见光通信具有无需频谱授权、保密性好、不会受到电磁干扰以及绿色环保等优势,因此可以作为射频通信的有效补充/替换方案。目前对可见光通信的研究主要集中在从LED到用户设备的单向通信。如何在LED与用
学位
随着移动设备在生活中越来越普及,各种各样的移动应用软件层出不穷。为了保证应用软件的可靠性,需要对其进行测试。GUI测试是软件测试的一种重要类型,目前有许多可用于移动端GUI自动化测试的框架,既有传统的基于系统内部控件属性的测试框架,如UIAutomator、Robotium等,也有基于图像的测试框架,如Sikuli、Airtest等。但是无论何种框架,都必须要求被测设备提供调试接口,来完成信息获取
学位
仪表在日常生活中随处可见,同时也在工业,国防,航空航天等领域起着重要的作用。目前仪表数据的读取大多采用人工读取的方式,该种方式效率低下且无法进行长时间的监测,同时带来了大量繁琐的文书工作。因此,基于机器视觉方式的自动仪表识别吸引了研究人员的注意。该种方式可以自动读取仪表示数,具有智能化,高效性等特点。仪表识别任务主要分为仪表检测,量程获取,仪表读数三个关键的子任务。而通过对现有的仪表识别算法的研究
学位
强化学习是机器学习领域的一个热门研究方向,近年来已取得重要进展,然而其面临着奖赏函数设计困难、环境探索效率低下、以及状态表示不够丰富等挑战,限制了其在实际任务中的应用。在很多实际应用中,除了让智能体直接探索环境以外,往往还可以收集到专家在该任务上的示范,为智能体的策略学习提供指导。从示范中学习也称为模仿学习,是解决上述挑战的重要途径之一。现有的模仿学习方法往往需要获取大量的专家示范作为训练数据,进
学位
车联网引起了学术界和工业界的极大关注,并且共享汽车服务作为车联网的一部分,在智慧城市的交通中变得越来越流行,共享汽车服务生成的大量数据由数据所有者收集。同时,随着机器学习等技术的发展,数据的价值已经开始产生巨大的潜力,数据交易也应运而生。目前,数据需要依托于集中式的数据交易市场中进行交易,数据的安全性和隐私性得不到保障。现有的工作尽管已经提出将区块链融入到数据交易的市场中,以及对于数据定价的研究,
学位