面向软件缺陷数据的特征选择方法研究和应用

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:wk1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
静态软件缺陷预测技术根据静态代码特征以及机器学习分类算法将软件模块分为有缺陷或无缺陷两类,已发展为软件缺陷预测的主要技术之一。但并非所有的软件特征对分类都是有益的,因此,对软件特征进行特征选择是保证软件模块准确分类的前提。特征选择按评价标准可分为:过滤式、封装式和混合式。过滤式根据特征的数学特性对其进行评价,不涉及分类器评价过程,具有快速、计算量小的特点;封装式选择方法根据特征作用于分类器后的分类效果评价特征优劣,其特点是准确但计算量大;混合式选择方法是将两种方法结合,可以在快速降维的同时保证计算精度。一般的特征选择方法都是基于数据分布平衡的前提下进行的,但软件缺陷数据往往是不平衡的,这就导致选择出的特征不利于有缺陷样本的分类。并且为进一步提高分类速度和精度,需要设计一个面向软件缺陷数据的高效分类方法。基于上述目标,本文的研究内容主要是以下三点:1.建立了一种将面向软件缺陷数据的混合式特征选择方法。将过程分为两个阶段:第一阶段利用信息熵及互信息理论计算出特征与类别之间以及特征之间的相关性,根据特征与类别间最大相关、特征间最小冗余的原则对原始特征集进行筛选得到候选特征集。2.在特征选择第二阶段,建立一种基于改进的Adaboost方法对候选特征集进行进一步特征筛选。筛选过程采用全新的样本权重更新策略,给予有缺陷且被误分类样本较高权重,对于被误分类的无缺陷样本,若其权重值超过阈值则剔除样本以此降低无缺陷样本权值过高带来的影响,从而进一步优化面向软件缺陷数据的特征选择结果。3.建立了一种基于软件特征的级联式软件缺陷数据分类方法。在特征选择的基础上,将已选择出的特征应用于级联式分类器,作为分类器的输入。若干个Adaboost强分类器串联形成级联式结构,级联分类器的前端可以剔除较易分类的无缺陷样本,有缺陷样本以及部分无缺陷样本参与级联分类器的后端运算,以此解决不平衡数据中有缺陷样本消耗过多系统资源以及单一Adaboost分类器容易产生冗余分类器等问题。为验证本文所提方法的性能,进行了仿真实验,实验结果表明本文提出的特征选择方法较传统的特征选择方法在分类性能上有一定的提升,并且将特征选择的结果作用于本文提出的级联式分类器,在保证了分类精度的同时也减少了分类时间。
其他文献
平板和圆管流动通道由于具有换热面积大、结构紧凑、便于设计广泛应用于紧凑式换热设备中,如板式换热器和管壳式换热器。然而换热设备流动通道内都存在不同程度的污垢问题,对
固态发酵是发酵基质中没有或几乎没有游离水的存在,并以气相为其连续相的发酵方式。水分在固态发酵过程中发挥着重要的作用,主要包括发酵基质营养的运输和热量的散发。随着发
本文主要利用矩阵零空间的性质,幂等矩阵的性质,群逆、Drazin逆的定义和待定系数法研究两个不同的幂等矩阵P,Q的一些组合在不同的条件下的群逆、Drazin逆的计算公式和指数.这些结果推广了两个不同的幂等矩阵P,Q的组合在特殊条件下的相应结果.本文主要研究以下内容:(1)运用矩阵零空间的性质证明了复数域上两个不同的非零幂等矩阵P,Q的组合a1P+b1Q+a2PQ+b2QP+…+a2n-1(PQ)n
荧光粉作为荧光粉型LED不可或缺的一部分,其性能的好坏大大地影响了LED器件所输出的光色品质。在荧光粉型LED实际的制造过程中,人们通常采用点胶的方式将荧光粉涂抹到芯片表
地理数据,是直接或间接关联着地球上某个地点的数据,也是表示地理位置、分布特点的自然现象和社会现象的诸要素数据。在使用地理数据的用户业务中,一个新颖而有实用价值的研究方向是针对地理轨迹的相似性分析。在进行犯罪同伙分析时,一般的犯罪同伙,都有着相同或者类似的轨迹。通过对相似轨迹的检索和相似度的排序,可以迅速找出最有可能协同犯罪的嫌疑人,从而极大提高侦察的效率。但是目前业界相关系统基本上都是关注轨迹的存
如今,无线通讯技术在当代社会中的重要性越来越高,人们对微波器件的性能要求逐渐向小型化、多通带、低损耗、高选择性的方向发展,特别是受到目前电子通讯设备越来越便捷化的
贵金属纳米粒子的物理化学性质取决于它们的形貌、尺寸、元素组成和界面性质。其在可见光或近红外波长光区内表现出强烈的局域表面等离子体共振(LSPR)性质。因此,不同形貌的贵金属纳米粒子在生物成像和比色生物分析中已经被广泛应用。但是,不同形貌、种类的贵金属纳米粒子与生物分子的相互作用强弱及其机制尚不清楚,如何选择合适的纳米探针应用于生物成像及分析受到局限。本论文旨在通过研究贵金属纳米晶与核苷酸之间的相互
奥扎莫德(Ozanimod),是一种新型口服、选择性鞘氨醇1磷酸受体(S1P1R)调节剂,开发用于自身免疫性疾病的治疗。其治疗多发性硬化症(MS)项目已处于III期临床,治疗克罗恩病(CD)项
改革开放以来,由于我国市场经济体制建立和不断发展,公司作为经济的细胞,它的生产和经营对我国经济具有举足轻重的影响。而有限责任公司作为公司形式的一种,在出资成立的过程
运动目标的检测和跟踪作为智能视频监控系统中的基础技术,广泛应用于生产、交通和安全等各个领域。通过监控视频可以获得很多有效的信息进行比对和分析,其中行人再识别研究就