类不平衡相关论文
针对分类任务中的不平衡数据集造成的分类性能低下的问题,提出了类不平衡数据的EM聚类过采样算法,通过过采样提高少数类样本数量,从根......
针对现阶段深度睡眠分期模型存在的梯度消失、对时序信息学习能力较弱等问题,提出一种基于双向长短时记忆卷积网络与注意力机制的......
当前,随着互联网的高速发展,万物互联的理念创造了更多的软件应用场景,而更多的应用场景也带来了更多的软件故障。如何在研发软件......
恶意加密流量识别公开数据集中存在的类不平衡问题,严重影响着恶意流量预测的性能。本文提出使用深度生成对抗网络DGAN中的生成器和......
城市地标是在结构、认知或视觉上比周围其他对象显著的空间对象,作为反映城市空间布局特征的重要元素,城市地标在空间认知和寻路导......
随着互联网技术的蓬勃发展,人们的生活越来越便利,但与此同时,网络安全问题也随之而来,严重影响着网络的应用及各类用户的安全,因......
道路提取作为遥感影像对象提取环节中的重要角色,可以为道路提供语义信息和位置信息,属于一种特殊的语义分割任务,目标是将图像像......
为了解决国内家庭经济困难学生的就学问题,政府非常重视对助学金的发放工作,通过国家政策、学校组织和学生监管贯彻落实对贫困生的......
针对于类不平衡的偏标记学习问题,提出一种可以较有效处理类不平衡问题的偏标记K近邻学习算法(K-nearest neighbor algorithm for c......
自闭症谱系障碍(Autism spectrum disorder,ASD)是一种常见的脑部疾病,近年来,随着计算机技术和医学影像分析技术的发展,使用静息态......
随着数据采集技术的不断发展,实际应用中收集到的数据逐渐呈现规模大、维度高和不平衡的特点。高维不平衡数据学习在许多重要应用......
互联网金融随着大数据的发展应运而生,作为金融业务的核心和基础,风险控制一直以来也备受关注。消费金融可有效提高居民的消费水平......
客户流失是许多商业部门都极其反感的问题。每个行业都渴望建立和保持一个忠实的客户群。在无线通信行业中,有许多因素会导致客户......
针对网络评论中普遍存在的负面评论较少而影响力却较大的类不平衡问题,提出一种基于类不平衡学习的情感分析方法.该方法利用深度学......
随着互联网用户群体急剧增长,网络规模迅速膨胀,网络业务类型也变得愈加复杂。为了提供安全、可靠的网络环境,对网络进行高效管理......
科学技术的发展促进了大数据时代的产生,使得数据已经日渐成为推动当今所有行业和业务职能领域发展的重要资源.如何从指数式增长的......
软件缺陷预测能够在项目开发中预测出可能存在缺陷的软件模块并对其进行重点测试。当前,软件缺陷预测根据预测目标主要包括分类预......
随着互联网的飞速发展,信息的表示形式越来越多样化。作为一种直观明了且易于理解的信息表达形式,图像已成为大数据的重要组成部分......
随着信息技术的快速发展,软件产品已经渗透到社会生活的各个领域,软件开发的规模和复杂度也随之增加。然而,软件中的缺陷是不可避......
类不平衡是数据挖掘领域的十大难题之一,在学术界和产业界备受瞩目。所谓类不平衡是指样本数据中某一类的样本远多于其它类样本,从......
microRNAs(miRNAs)是具有保守性的短核苷酸序列,在基因转录调节中扮演着重要的角色。将microRNA序列特征进行量化,采用机器学习技......
针对SMOTE(synthetic minority over-sampling technique)等基于近邻值的传统过采样算法在处理类不平衡数据时近邻参数不能根据少......
大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可......
近年来,类不平衡问题已逐渐成为人工智能﹑机器学习和数据挖掘等领域的研究热点,目前已有大量实用有效的方法.然而,近期的研究结果却......
极限学习机广泛用于分类、聚类、回归等任务中,但在处理类不平衡分类问题时,前人未充分考虑样本先验分布信息对分类性能的影响。针......
针对背景知识数据集中存在的类不平衡对分类器的影响,根据背景知识数据集样本量小、数据维数高的特性分析了目前各种方法在解决背......
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,......
在实际电子侦察过程中,由于各种原因,侦收到的不同类型信号数量相差很大,类别之间严重不平衡,常规方法在这种数据集下训练得到的分......
特定类的思想是将传统的多类特征提取和识别任务转化为多个两类问题,由此产生了类不平衡问题,影响最优鉴别特征的提取。为了解决该......
现实生活中数据的分布往往是非线性且不平衡的,传统的线性鉴别方法已经很难提取有效的鉴别信息,于是文中将算法扩展到核空间,提出......
软件缺陷预测是提升软件质量的重要手段。为了改善缺陷预测性能,目前许多机器学习领域的最新成果已经引入到软件缺陷预测中。但是,......
软件缺陷预测有助于提高软件开发质量,保证测试资源有效分配。针对软件缺陷预测研究中类标签数据难以获取和类不平衡分布问题,提出基......
摘 要: K-means型算法在处理类不平衡数据时趋向于形成大小相同的簇,是“均匀效应”。针对这一问题诸多研究者提出了不同的聚类算法,......
针对P2P类不平衡问题提出将复杂的多类不平衡问题转化为简单的两类不平衡问题,再通过迭代SMOTE过抽样技术丰富P2P的概念表达,从而......
针对因不平衡数据中小类实例少、关联分类算法挖掘到小类规则少且小类规则的置信度较低,使得小类规则排序优先级低,从而导致小类的......
产品质量自动检测是一种类不平衡的模式识别分类。传统的机器学习方法考虑整体精度而偏重多数据类,但分布少的缺陷类才是重要类。......
对于不平衡类数据集的分类问题,训练分类器后,分类结果产生了向多数类偏斜的问题,少数类识别率较低。为了提高少数类的分类精度,提......
随着数据挖掘的发展,多标签分类如今已被广泛应用在文本分类、图像分类、生物信息学、信息检索以及视频处理等领域中。多标签分类......
对企业来说市场竞争越发激烈,其在做好自身管理的同时,严格做好供应商管理,构建一个稳定运行的供应链体系,能够有效提升自身竞争力......
现如今,电信运营商市场趋于饱和,携号转网政策的全面实施无疑加剧了运营商之间的竞争,如何保留老用户成为了运营商日常业务中最为......
随着信息技术的不断发展和大数据时代的到来,各个不同的领域产生了大量的多标签数据集,而且数据集的规模也越来越大.如何有效地挖......
近年来,软件缺陷预测在软件工程领域引起了研究者的广泛关注,基于机器学习的缺陷预测技术成为了研究的热点。软件缺陷预测主要是基......
客户流失给运营商带来巨大的损失,根据相关研究,对于运营商而言,开发一个新用户的成本至少是挽留一个老用户成本的6倍。而且,高价......
类不平衡问题是模式识别和机器学习领域的热门研究问题之一,其特征是某些类实例数明显少于其它类实例数。在实际应用中,正确识别少......
为克服不平衡数据集中存在的噪声、小分离、类内和类间不平衡问题,提出一种基于HDBSCAN(hierarchical density-based spatial clus......