基于集成学习的软件缺陷预测研究

来源 :淮北师范大学 | 被引量 : 0次 | 上传用户:vener123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学技术迅速发展的今天,随着社会信息化建设不断推进,信息技术广泛应用,各行各业都离不开计算机软件的支持,软件的可靠性正逐渐成为人们关注的焦点。软件存在的缺陷越少,软件的可靠性就越高,系统也就越稳定。因此,软件缺陷预测是一个重要的研究课题。然而在实际研究中,经常因缺乏足够的标记样本导致预测模型得不到有效的训练。另外,缺陷样本集存在严重的类不平衡问题,数据分布不平衡影响模型的预测结果。同时,样本数据包含大量的冗余特征信息,这也会影响模型的预测性能。因此,本文综合考虑软件缺陷预测中常常遇到的标记样本不足、类不平衡和特征冗余问题,提出以下解决方案,并选用NASA、AEEEM和MORPH公开数据集开展实验:首先,针对缺陷数据的类不平衡问题,本文对数据集先做欠采样再做SMOTE过采样以降低数据的不平衡度。与不做数据采样的原始数据及随机欠采样、随机过采样、SMOTE过采样进行实验比对,证明了数据重采样的必要性和混合采样的有效性。其次,针对特征冗余问题,本文使用SMA优化算法选择最优特征。与不做特征选择的原始数据及PSO、GWO算法进行实验比对,证明了数据普遍存在冗余或无关特征的结论和SMA优化算法的优越性。最后,针对标记样本不足问题,本文在UDEED算法的基础上引入聚类算法,提出一种改进的基于半监督集成学习的软件缺陷预测方法SUDAda Boost。结果表明,SUDAda Boost不仅优于初始的Ada Boost算法,并对缓解类不平衡问题具有良好性能。
其他文献
机器视觉检测是一种无接触、无损伤的检测技术,是实现设备高效、智能和精密控制的有效手段。机器视觉检测主要是运用图像处理技术及相关优化算法完成设计的,但很多优化算法耗费计算资源多且运算周期较长,所以,越来越多的学者尝试将优化算法移植到实时性较好的便携式设备中,完成对相关产品的质量检测。FPGA(Field Programmable Gate Array)以其突出的硬件加速并行处理功能使高速处理计算的问
学位
基于证书加密方案是公钥加密的一个重要分支。基于证书加密方案使用证书颁发机构并为用户颁发证书。用户均使用私钥和最新证书才能解密密文。基于证书加密方案解决了基于身份加密方案存在的密钥托管问题以及密钥分配问题,还解决了传统公开密钥加密(PKE)中有关第三方查询以及证书管理方面的问题。因此,基于证书加密方案的研究具有重要理论实际意义。本文针对基于证书加密方案进行研究,主要包括:(1)大部分基于证书加密方案
学位
类噪声脉冲(Noise-like Pulses,NLPs)具有高能量低相干性的特点,在光纤传感、激光微加工和激光烧蚀等领域有着广泛的应用。光纤激光器工作在L波段时硅纤维的损耗较低,并且传输容量高,因此L波段激光器在现代光通信系统中得到了广泛的应用。与常规锁模脉冲相比,利用非线性偏振旋转(Nonlinear Polarization Rotation,NPR)技术在光纤激光器中产生矩形类噪声脉冲是获
学位
随着各个国家对含铅的钎料禁止生产和使用,SnAgCu系新型无铅钎料性能优异,是人们认为代替含铅钎料的优异材料。在电子封装领域,微电子芯片焊接结构尺寸变得越来越小,这会导致模型中的电流密度增大,使得集成电路升温明显,最终会导致电迁移现象的发生。电迁移现象一般发生在电子元器件的焊接结构中,焊点的阴极产生孔洞,孔洞会影响元器件稳定性,导致焊接结构短路或断路、产生裂纹等现象,随着电迁移现象的加剧孔洞增大,
学位
现有热工规范中关于墙体传热系数限值大多从传热的角度进行计算,并未考虑湿传递对墙体传热过程的影响。然而实际情况下建筑材料含湿后对导热系数影响很大,导致墙体传热系数远超热工规范规定的传热系数限值;而对于热工性能更为薄弱的建筑墙角,该处的传热系数远大于一维墙体,使得该处更易发生结露现象。因此准确掌握考虑传湿后的墙体及墙角内表面的热湿状态,并提出避免内表面发生结露现象的措施,对保证建筑的使用寿命、节约建筑
学位
在零售领域,传统的商业模式已经无法满足用户的需求,因此,一种新型的商业模式-电子商务就产生了,人们的购物习惯逐渐向互联网转变。然而,随着电子商务的快速发展,各类信息层出不穷,用户无法从中快速获取到感兴趣的信息。对于各类购物平台,商家也无法获取用户的偏好并为其提供个性化推荐服务。因此,如何利用推荐系统从海量的商品数据中发现有用的信息成为一个重要的课题。当前大多数算法主要利用用户对物品的行为进行推荐,
学位
素养导向的大单元教学以核心素养为目标导向,围绕学科大概念、大任务、大主题等,将具有内在关联的学习内容进行系统性、结构化整合。其基本要素有:架构大单元教学主题,确定大单元学习目标,设计大单元评价任务,构建大单元学习过程,设计大单元进阶作业,评价反思大单元学习。与之相应的,有三条实施策略:对照课标,提炼主题,规划大单元教学架构;基于学情,任务驱动,设计大单元学习过程;细化目标,分课实施,推进大单元教学
期刊
硝基酚类化合物(NACs)是棕色碳(Br C)气溶胶的重要组分之一,由于NACs具有毒性、且会在影响辐射平衡的同时引起气候变化使其成为目前的研究热点。近年来对NACs的研究主要集中在其季节变化和可能生成机制的探究,然而,对于区域NACs化学成分、吸光特性和来源等研究尚不明确。因此,本研究于2019年12月24日至2020年1月12日在我国关中地区典型城市西安市连续采集了四小时高分辨率细颗粒物(PM
学位
庄廓民居作为青海东部地区最主要的民居类型,蕴含着极其丰富的营造智慧。但是,由于各种各样的问题,它的存在及发展受到很大制约。首先由于目前大部分庄廓民居缺乏应有的保护,许多传统庄廓民居逐渐衰落,相关技术濒临失传;其次随着新材料,新结构,新技术层出不穷,在庄廓新民居的建设中,地域性、节能性以及环保性常常受到忽视;最后,在现代化的社会背景下,传统的传承方式在传承过程中容易导致营造技术的流失和失真。本文分别
学位
在电子产品设计验证、批量生产过程中,模拟电路的检测与故障诊断技术一直是电子检测领域研究的重要内容。由于模拟电路元器件非线性和容差性,使得模拟电路诊断相关技术发展相对迟缓,从而导致目前没有较为完整成熟的模拟电路故障诊断系统,难以满足电子工业发展中电路测试与诊断的需求。因此,开展模拟电路故障诊断技术研究具有重要的理论意义和实际应用价值。本文对SVM模拟电路故障诊断模型进行重点研究。小波包分析具有很好的
学位