一种面向跨项目软件缺陷预测的特征过滤与实例迁移框架

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:lieren001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在跨项目软件缺陷预测中,源项目与目标项目的特征关联度与实例分布差异性是影响预测模型性能的主要因素.本文从特征过滤与实例迁移2个角度出发,提出一种跨项目软件缺陷预测框架KCF-KMM(K-medoids Cluster Filtering-Kernel Mean Matching).在特征过滤阶段,该方法基于K-medoids聚类算法来筛选特征子集,过滤与目标项目关联度低的特征.在实例迁移阶段,通过KMM算法计算源项目与目标项目实例间的分布差异度,以此分配每个训练实例的影响权重.最后,结合目标项目中少量有标注数据建立混合缺陷预测模型.为了验证KCF-KMM的有效性,本文从准确率和F1值的角度出发,分别与经典的跨项目软件缺陷预测方法TCA+、TNB和NNFilter相比,KCF-KMM的预测性能在Apache数据集上可以分别提升34.1%、0.8%、21.1%和14.4%、3.7%、10.6%.
其他文献
由于密度不同的雨对图像造成的遮挡不同,图像去雨一直都是一项极具挑战性的任务.目前,基于深度学习的图像去雨算法已经成为主流.然而,多数深度学习的架构都是通过堆叠卷积层来设计的,执行去雨任务后图像仍存在着大小不一的雨痕,这些方法并不能很好地关注训练中雨图的局部信息和上下文信息.为了解决上述问题,本文设计一种基于多通道分离整合的卷积神经网络用于图像去雨.第一步通过通道分离,再利用卷积层间的层级连接,构成多尺度模块,最终将不同通道的输出进行整合.该模块可以增大感受野,探索特征图之间的空间信息,更好地提取特征.第二
针对苹果栽培品种识别分类问题,提供一个包含多个苹果果树品种的叶片图像原始数据集,并且研究构建一种新的深度卷积神经网络分类模型,对其分类准确性、泛化性能和稳定性进行对比验证,以期对苹果栽培品种简便、快速、准确的识别分类提供理论依据和技术支持.以甘肃省平凉市静宁县果树果品研究所苹果良种苗木繁育基地作为实验基地,在其中选取14个苹果果树品种.每个品种选取10棵左右树龄、树势、长势都存在差异的果树,采摘100片左右成熟的、无机械损伤的叶片,然后拍摄叶片图像建立数据集,进而利用卷积神经网络训练识别分类模型.本文针对
视频快照压缩感知基于压缩感知理论,仅在一次曝光过程中将多帧画面投影至二维快照测量,进而实现高速成像.为了从二维快照测量信号恢复出原视频信号,经典的重建算法基于视频的稀疏性先验进行迭代优化求解,但重建质量较低,且耗时过长.深度学习因优异的学习能力而受到广泛关注,基于深度学习的视频快照压缩重建方法也得到关注,但现有深度方法缺乏对于时空特征的有效表达,重建质量仍有待进一步提高.本文提出视频快照压缩感知重建的多尺度融合重构网络(MSF-Net),该网络从横向的卷积深度和纵向的分辨率2个维度展开,分辨率维度利用三维
电网工程图纸矢量化识别是实现电网领域基础图纸数字化的一种重要技术途径.由于电网中的电气元件类别多,其中部分图像背景模糊,电气元件的旋转角度不一致,从而对图纸中的电气元件的识别造成一定挑战.本文提出一种基于深度学习中Faster RCNN网络架构的电气元件识别和训练方法,将需要训练的样本数据进行预处理和特征提取,在预处理过程进行平滑去噪、二值化、分割等操作,在特征提取过程采用VGG16网络,利用深度学习方法对电网图元进行识别.在包含9类电网图元的真实数据集上的实验结果表明,本文方法对电网工程图纸中的电气元件
针对紧凑型卷积神经网络在部署现有注意力机制存在计算量或参数开销大的问题,提出一种改进的超轻量化子空间注意模块.首先,深度连接的子空间注意模块(Deep Connected Subspace Attention Mechanism,DCSAM)划分特征图为若干特征子空间,为每个特征子空间推导不同的注意特征图;其次,改进特征子空间进行空间校准的方式;最后,建立前后特征子空间的连接,实现前后特征子空间的信息流动.该子空间注意机制能够学习到多尺度、多频率的特征表示,更适合细粒度分类任务,且与现有视觉模型中的注意力
在机器人流程自动化(Robotic Process Automation,RPA)软件中,经常采用序列推荐系统让机器人完成判断、选择等人工处理的任务.然而常用的序列推荐系统受限于序列信息的提取困难等问题,难以得到广泛应用.为了解决这一问题,构建一种基于Inception的卷积序列推荐模型,把时间和潜在空间中的用户行为序列信息嵌入进一幅“图像”中,并通过动态和静态2种不同的卷积层提取其中的局部特征,全面地提取用户的短期兴趣偏好,同时将用户嵌入矩阵作为用户的长期兴趣偏好嵌入到卷积层的输出中,共同构建完整的用户
随着汽车的普及,交通拥堵问题日益严重,依靠传统云计算的智慧交通系统虽能在一定程度上缓解交通压力,但已无法满足辅助驾驶、自动驾驶等新型车载应用对传输带宽与时延的需求.为了实现海量数据的实时处理,保障公众信息及交通安全,提升交通系统运行效率,将边缘计算应用于智慧交通.首先对智慧交通的发展概况进行整体描述,提出基于边缘计算的智慧交通总体架构,充分利用边缘计算物理邻近、高带宽、低时延、位置认知的特点解决目前交通系统信息传递延迟、数据处理不及时、传输负载大等问题.然后,基于无线传输、信息感知、计算卸载及协同处理等方
针对列车车轮踏面旋转纹理信息无法准确、有效提取的问题,提出一种基于Radon变换和双树复小波变换(DT-CWT)的列车车轮踏面特征提取方法.首先,对车轮踏面图像进行Radon变换;然后,对变换后的图像进行DT-CWT分解,使用分解后的各层低频子带系数和高频子带系数模的均值和标准方差构造特征向量,将其作为区分列车车轮踏面是否发生损伤的依据;最后,由支持向量机(SVM)进行分类决策.使用动车所采集的图像及人为加噪声后的图像进行分类实验,结果表明,本文使用的Radon和DT-CWT算法能有效地进行旋转不变纹理的
语音情感识别是计算机理解人类情感最直接的方式,是实现人机交互智能化的重要渠道,但识别模型的性能需要进一步提升.为实现这一目标,提出一种基于循环卷积神经网络的语音情感识别模型ARCNN-GAP.其中,循环卷积层具有弹性路径,在确保网络深度的同时能保证优化时的梯度回传,提取更加有效的情感特征;全局平均池化运算可以在减少计算复杂度的同时降低过拟合风险;而注意力机制能够使模型更多关注情感相关特征.使用韵律特征和谱特征的融合特征在CASIA和EMO-DB数据库上进行研究,分别取得了83.29%和75.28%的识别率
微博作为当代生活中信息传播的重要平台,对其进行热点话题挖掘成为当今重要的研究方向之一.针对传统的热点话题发现方法在处理微博文本时存在文本表示缺乏语义信息、挖掘热点话题效果差等问题,本文提出一种基于频繁词集和BERT语义的文本双表示模型(Text dual representation model based on frequent word sets and BERT semantics,FWS-BERT),通过该模型计算加权文本相似度对微博文本进行谱聚类,进一步基于改进相似性度量的affinity pr