基于多次随机欠采样和POSS方法的软件缺陷检测

来源 :山东大学学报(工学版) | 被引量 : 0次 | 上传用户：a77115280

【摘要】

：

为了解决因软件缺陷数据存在数据不平衡问题限制了分类器的性能,将POSS(pareto optimization for subset selection)特征选择算法和随机欠采样技术引入到软件缺陷检测中,并利

【作者】

：

方昊李云

【机构】

：

南京邮电大学计算机学院,

【出处】

：

山东大学学报(工学版)

【发表日期】

：

2017年01期

【关键词】

：

软件缺陷检测不平衡性数据采样特征选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了解决因软件缺陷数据存在数据不平衡问题限制了分类器的性能,将POSS(pareto optimization for subset selection)特征选择算法和随机欠采样技术引入到软件缺陷检测中,并利用支持向量机(support vector machine,SVM)构建预测模型。试验结果表明,通过多次随机欠采样可以有效地解决软件缺陷数据不平衡问题,同时使用POSS方法对目标子集进行双向优化,从而提高分类的准确率,其结果要优于Relief、Fisher、M I(mutual information)特征选择算法。 In order to solve the problem of the data unbalance caused by the software defect data, the performance of the classifier is limited. The POSS (pareto optimization for subset selection) feature selection algorithm and the random under-sampling technique are introduced into the software defect detection and the support vector machine, SVM) to build a predictive model. The experimental results show that the problem of software defect data imbalance can be effectively solved by multiple random undersampling, and the target subset is bi-directionally optimized by POSS to improve the classification accuracy. The result is better than that of Relief, Fisher, MI (mutual information) feature selection algorithm.

其他文献

数学文化体现在立体几何专题中的教学研究

2017年《高中数学课程标准》提出了“六大数学核心素养”即数学抽象、逻辑推理、数学建模、数学运算、直观想象、数据分析,它是五大基本能力和两个意识的延续和深化.2017年高

期刊

新课改数学文化核心素养立体几何

多元化健康教育模式在中风患者及照顾者中的应用

目的：探讨对中风患者及照顾者实施多元化健康教育模式的效果。方法：收治患者88例，按随机投掷法分为对照组和研究组各44例，对照组给予一般护理，研究组在一般护理中增加多元化健康教

期刊

健康教育中风患者照顾者

民族声乐演唱中的情感表达和个性体现

社会的发展使得人们越来越追求精神生活,这在一定程度上也推动了我国民族声乐演唱事业的发展,表演者可以借此来表达内在情感,同时可以借助个性体现来为民族声乐艺术注入生命

期刊

民族声乐演唱情感表达个性体现

马铃薯雪花全粉制酒工艺优化

以马铃薯雪花全粉为原料,安琪酿酒活性干酵母(angel active dry yeast,ADY)为发酵剂,制得马铃薯酒;通过单因素和正交试验优化马铃薯酒发酵的工艺条件。结果表明:最佳发酵工艺

期刊

马铃薯液态发酵工艺优化正交试验高级醇

民族声乐演唱中的情感表达与个性体现分析

民族声乐是我国劳动人民在长期劳动和生活中传承和积累下的艺术瑰宝,其包含民族之情和国家之情,充分体现了我国人民的审美理念、价值观念和性格特点,在演唱民族声乐中,演唱者

期刊

民族声乐情感表达个性特点分析

老年肺结核合并肺源性心脏病的临床护理分析

目的分析老年肺结核合并肺源性心脏病的临床护理效果。方法选取本院2016年3月-2017年3月收治的62例肺结核合并肺源性心脏病患者作为研究对象,将其随机分成对照组(31例)和实验

期刊

老年肺结核肺源性心脏病临床护理效果

民勤县农村饮水安全工程运行管理探讨

自2002年以来,民勤县相继实施了国家一、二期农村人饮解困、氟病改水、人畜饮水和饮水安全等项目,截至目前共建成集中供水工程45处,解决了全县18个镇23.45万农村居民的饮水安

期刊

民勤县农村饮水运行管理

基于SIFT算法的图像特征匹配

SIFT特征匹配算法的原理在于生成特征点的SIFT特征向量，通过对特征向量之间的匹配来实现图像之间的匹配。SIFT特征是一种尺度不变的局部图像特征，阐述生成SIFT特征向量的具体过

期刊

图像匹配SIFT特征匹配尺度空间方向向量特征描述子

改进RRT*的室内机器人路径规划算法

路径规划在室内机器人的应用中有着无可比拟的作用;为了提高路径规划算法收敛的速度,综合时间消耗和路径质量方面考虑,针对RRT*(渐进最优快速扩展随机树)算法的局限性,提出一

期刊

RRT*人工势场目标偏向性曼哈顿距离

激光分子束外延制备中高温超导薄膜化学稳定性研究

提出一种激光分子束薄膜制备方法,并对制备完成的高温超导薄膜化学稳定性进行研究。以活化气体作为薄膜制备的氧源,选用Sr Ti O3基片作为衬底,临界转变温度和临界电流密度分

期刊

激光分子束外延薄膜临界转变温度临界电流密度

基于多次随机欠采样和POSS方法的软件缺陷检测

其他学术论文