不平衡分类相关论文
在数据分析的应用中,数据质量是一切分析研究的基础,针对电网运行过程中输变电设备基础数据质量不高的问题,首先介绍了电力系统不......
传统分类模型通常基于数据分布平衡的假设,然而由于数据的自然分布或数据收集等原因,许多现实生活中的数据分布是不平衡的。模糊支......
针对贫困生数据类别不平衡、特征复杂等特点,提出ADA-MDF贫困生认定模型。首先利用ADASYN自适应过采样方法,通过合成少数类别样本,改......
癌症的早期发现和诊断在病人的治疗和护理中起着至关重要的作用。组织病理学分析是目前诊断癌前病变的金标准。然而,由于外观、异......
在现实生活中,存在大量的样本类别不均衡数据,比如信用卡欺诈数据、罕见疾病数据等。基于不平衡数据的分类,称为不平衡分类,分类器......
不平衡分类是一个重要的研究领域。在不平衡数据集中,至少有一类(少数类)的样本数量是远远少于其它类别的样本数量。如果在不平衡数......
制造业是国民经济的基础,而数控机床作为基础制造能力构成的核心,其关键部件若出现故障将直接降低机床加工效率,因而对关键部件进......
不平衡分类是当今机器学习中的研究热点与难点.为提高不平衡数据的分类效果,提出MetaCost与重采样结合的不平衡分类算法——RS-Met......
在监督分类中数据的不平衡性是导致各种分类算法效果不佳的主要原因之一,尤其在一些实际问题中,少数类被错分的代价极高,此时我们......
目的:针对信用评分样本类别不平衡问题,提出一种新的分类方法——合成少数类过采样技术-自适应增强-决策树(SMOTE-AdaBoost-DT)模......
在信息技术与教育融合的新型在线学习环境下,理解在线学习者的学习规律进而预测其学习成效,对于提升在线学习者的学习效果、效率及......
通常孤立点所占比例较小,在孤立点检测中需要同时解决数据不平衡和代价敏感两个难题。本文提出了一种两阶段的孤立点检测方法。第一......
在极度不平衡分类问题中,球形分类器将分类正确样本的损失计为零,仅使用误分样本构造决策函数.文中提出光滑有下界的奖惩结合损失......
针对水声目标-杂波数据集在有限样本下的类不平衡特性导致代价敏感支持向量机难以逼近贝叶斯最优决策的问题,该文提出了一种基于能......
空腹血糖(Fasting Blood Glucose,FBG)是衡量人体健康的一个重要指标。对空腹血糖的分析预测对发现和治疗疾病有重要意义,尤其是对......
学位
随着信息技术的发展,数据挖掘技术作为目前计算机研究的热门领域,在社会各方面得到广泛使用,它旨在从大量数据中挖掘出有价值的信息。......
生物信息学研究生物数据的分析处理方法。生物信息学的发展过程是分子生物学与计算机技术、数学、信息学和工程领域不断交叉与融合......
癫痫发作自动检测技术对癫痫患者的诊断和治疗具有重要意义.由于癫痫发作期持续时间较短,发作期与非发作期的脑电数据分布是不平衡......
互联网的飞速发展,能够为用户提供海量信息,满足用户在信息化时代对信息的需求。然而,互联网在为用户提供海量信息的同时,也带来了......
基于深度神经网络的遥感图像场景分类很难在训练数据不均衡时取得较好的性能。为了缓解这个问题,提出了一种对样本进行混合采样并......
锚杆支护如今作为一种常用的加固手段广泛应用在各种岩土工程中。受施工因素的影响,工程中由灌浆质量不合格引发的安全问题不在少......
图像作为重要的信息载体,广泛存在于我们的生活中。从单个图像中恢复物体的深度次序关系,一直被认为是理解和感知的重要能力。在计......
在现实生活中,存在大量的样本类别不均衡数据,比如信用卡欺诈数据、罕见疾病数据等。基于不平衡数据的分类,称为不平衡分类,分类器......
近年来,机器学习作为人工智能的重要一部分,越来越被人们熟知。面对庞大的数据量,人工进行数据处理、数据分析已经极不现实,采用机......
互联网技术催生了一大批新兴产业,促使互联网金融业蓬勃发展,不论是京东白条、蚂蚁花呗还是P2P网贷,越来越多的信用消费产品走入人......
图作为一种描述事物与事物之间关系的数据结构,常常被用来表征复杂的数据关系。基于图结构的节点分类任务在社交、政治和生物工程......
信用卡欺诈是指故意使用伪造他人信用卡,盗刷他人信用卡用于本人消费,或用信用卡进行套现的违法行为。信用卡业务是银行的主营业务......
一般而言,多标签学习与单标签学习最大的区别在于,多标签数据的标签被组织在一个标签向量中,而且标签之间往往具有很复杂的关联信......
获取最为精确的分类效果从来都是机器学习方法所追求的研究目的,大多数的机器学习分类模型,一般都是根据平衡数据所设计的,模型只......
关系分类在自然语言处理中是一个关键性热点问题,其对于问答系统、推荐系统和情感分类任务的构建都有非常重要的意义。如果能够有......
不平衡数据的分类问题普遍存在于实际应用中,例如,医疗诊断,网络入侵检测和生物数据分析。少数类样本往往隐藏着更重要的信息,错误......
分类问题是一个十分重要的课题,传统的分类算法大多基于类别平衡的情况。但是,在实际问题中,存在着大量类别不平衡的数据,这给分类......
现今时代是一个人工智能时代,机器学习作为其重要组成部分获得了巨大的发展,尤其是在有/无监督学习领域。然而随着计算机技术的快......
基于范数定义的度量学习是机器学习、模式识别领域的基础性工作之一。最为常用的是基于L2范数的欧氏距离和马氏距离,因其易于求解(......
为了解决不平衡数据分类问题,人们提出了许多基于采样的预处理方法。这些方法的基本原理是通过具体的策略重新平衡数据集。针对不......
多聚腺苷酸化(Poly(A))是基因表达的一个重要步骤,它对转录本稳定性和蛋白质翻译起始必不可少,因此受到了复杂的调控。选择性多聚......
在机器学习不平衡分类方法研究中,由于多数类与少数类样本数量之间存在较大差异,导致分类器易出现判定准确率低的问题.以SMOTE为代......
针对现有不平衡分类问题中过采样方法不能充分利用数据概率密度分布的问题,提出了一种基于隐变量后验生成对抗网络的过采样(LGOS)......
数据类别不平衡对轴承故障的诊断有很大影响,而生成对抗网络(Generate Adversarial Net)作为最热门的神经网络之一,在数据生成方面......
机械设备实际工作过程中正常样本丰富、故障样本匮乏,卷积神经网络在处理这种分布不平衡的数据时对少数类的识别率很低.为解决上述......
从海量恒星光谱中发现稀有光谱是天文学研究的重要课题之一。与一般光谱相比,稀有光谱数量较少,因此,传统分类方法无法正常工作。究其......
煤炭作为我国重要能源之一,其产量近年来节节攀升,然而,由此带来的矿井水害事故也在增多。因此,准确、快速地判别突水水源对煤矿水......
随着科学技术的飞速发展,各种媒体不断涌现,文本作为数据的一种载体,数量也日益增多,文本挖掘已成为研究领域的热点。目前,随着计......
交通拥挤识别实质上是一种不平衡分类问题,通过解决不平衡分类问题,在数据层面对原始数据集进行重采样,并采用不同的采样倍率进行......
针对不平衡数据集上的分类问题,提出了基于Lévy分布的过采样方法,其核心思想是根据初始数据集的分布,利用Lévy分布构造新样本的......