smote相关论文
针对传统机器学习模型在医疗小样本数据上由于浅层模型结构和复杂数据特征而导致分类表现不佳的问题,本文提出了一种改进模型cgicFo......
为了提高财务风险预警模型的有效性,解决样本数据不平衡问题、优化预警指标降维程序,文章提出了一种用于财务风险预警的SMOTE-双层XG......
在健康中国大背景下,人们对用药安全的需求日益提升。近几年,随着中国对上市后药品安全监测的加强,国家药品监督管理局每年以自发......
本研究基于浙江省统计局“全面覆盖+精准画像”数据库,从人员、家庭、社会环境三个层面构建浙江省居民收入预测指标体系,并结合抽样......
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样......
近年来,冠心病患者人数不断增加,而集成学习具有良好的冠心病风险预测能力,可降低患者就医成本,提高冠心病筛查的效率。本文利用Kaggle......
不平衡数据集在当今社会生活中大量存在,如肺癌病人诊断数据、信用评估数据、网络攻击识别数据等。针对不平衡数据集的分类叫做不......
随着信息时代的飞速发展,行人的定位与导航在军事、考古、日常出行等场景中扮演着越来越重要的角色。行人的轨迹估算常用的方法有......
数字货币作为一款新兴的投资产品,由于其良好的技术应用前景和较高的投资回报率,在交易市场受到追捧。与其他投资产品一样,市场迫......
该文针对信用卡欺诈客户数据集极不平衡的特点,设计了SMOTE、Borderline SMOTE、ADASYN、SMOTENC四种采样算法,对数据集进行均衡处理......
针对信用数据中的高维稀疏特征与样本不平衡问题易导致模型分类性能欠佳,提出一种新颖的框架来构建信用评分模型.首先,通过计算特......
心血管疾病Cardio-Vascular Disease(CVD)是全世界主要的死亡原因之一,预计到2025年将有2360万人受到CVD的攻击。因此,医疗保健行业......
近年来,随着社会经济快速发展,互联网使商品数据呈指数爆发式增长,推荐系统能够帮助人们从海量商品信息中找到相关或喜好的商品,且......
语音是人机交互过程最自然,最符合用户需求的交互方式。亚马逊echo和谷歌home智能音箱可以通过语音控制家电。嵌入问答系统的电热......
利用天气雷达三维网格拼图资料,并针对正负样本数据不平衡问题,使用SMOTE方法进行处理,通过设计多层卷积神经网络,在网络末端加入S......
随着我国房价的逐年攀升以及购房压力日益加剧,国家对住房租赁市场愈发重视。十九大报告提出,要加快发展和培育住房租赁市场,构建......
不平衡数据分析是智能制造的关键技术之一,其分类问题已成为机器学习和数据挖掘的研究热点。针对目前不平衡数据过采样策略中人工合......
为了缓解软件缺陷预测的类不平衡问题,避免过拟合影响缺陷预测模型的准确率,本文提出一种面向软件缺陷预测的基于异类距离排名的过......
雷达辐射源信号识别是电子战的关键部分,很大程度上影响了战争的结果。随着电磁技术的不断进步,新体制雷达的不断研制,战场电磁环......
目的:弥漫大B细胞淋巴瘤(DLBCL)是一种血液恶性肿瘤,具有明显的异质性,可以侵袭不同年龄段的患者,且患者的临床表现各异。尽管目前的......
软件度量数据库的复杂性使得缺陷数据集和无缺陷数据集模块难以区分,而从数据模型的发展过程来看,软件度量数据集对于度量数据的预......
随着中国对外贸易量的大幅增长,海关监管任务加重.实际监管中违法违规的贸易量只占小部分,无差别检查将造成资源浪费.为合理化分配......
肾移植手术在当今的应用越来越广泛,对于排斥反应的预测变得更加重要.针对排斥反应数据特点中存在的数据的维度高、数据时序性、样......
随着工业互联网的发展,带来终端传感设备数量激增,传输与存储的数据呈现爆炸式增长,企业、机构通过数据挖掘能够进行一系列的分析......
为了提高磁瓦表面缺陷在线检测准确率并降低检测时间,提出一种基于机器视觉的检测方法。离线训练时,对经过Gabor小波处理后的子图......
将机器视觉技术引入到了茶小绿叶蝉的自动识别领域,以实现茶园中茶小绿叶蝉的准确及时预报。采集了自然场景下黄色诱虫板的图像,利......
变压器在电力系统中发挥着变换电压、分配电能等重要作用。其故障缺陷将严重危及电力系统的安全运行,从而造成巨大的经济损失和不......
为解决实战运用中已有机器学习算法对侦察低截获雷达型号的识别问题,提出基于样本扩展与生成技术的识别框架。研究基于K-means和组......
基于2020年佛山市承租人满意度问卷调查数据,使用SMOTE方法进行样本均衡化处理,运用有序Logit回归方法对承租人满意度的影响因素进......
列控车载设备故障复杂且车载记录数据为海量非结构化文本,针对车载记录数据特点,提出基于卷积神经网络的车载设备故障智能分类模型......
对油耗数据进行区间预测时,数据的不平衡性会导致一般的区间预测方法得到的预测区间质量较低。针对上述问题,提出了基于SMOTE-XGBo......
针对软件代码存在安全隐患等问题,提出一种基于邻域划分加权SMOTE算法的Transformer-CNN(TF-CNN)源代码漏洞检测模型,并且对Transf......
伴随着现今这种数据大爆炸的时代趋势,图像数据作为这些数据中非常重要的数据应用在各个领域中。越来越多的学者们将研究方向放在......
摘 要: 在网络入侵检测中,异常样本通常要比正常样本少得多,数据的不平衡问题会导致检测模型的分类结果倾向于多数类,影响模型准确率。......
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年......
由于互联网和计算机网络技术的不断发展,用于检测未授权访问、行为不端和异常攻击的网络流量分析越来越受到相关研究人员的重视。......
随着计算机存储与数据采集技术的高速发展,基因组学、财务预警、文本分类、客户流失预测和垃圾邮件识别等应用领域产生的海量数据......
针对入侵检测系统对于未知攻击训练较少,导致特定攻击检测率低的问题,提出一种融合最大相异系数密度的SMOTE入侵检测方法。利用改......
长链非编码RNA是指一类长度大于200个核苷酸单位、不编码蛋白质的RNA。之前人们普遍认为编码蛋白质的基因才是主角,但是越来越多的......
粮食损失浪费与我国节粮减损的重大战略以及国家粮食流通环节的产业绩效息息相关,减少损失浪费一直是我国粮食流通行业的关键任务......
类别不平衡问题是机器学习和数据挖掘等领域中主要关注的问题之一。特别是近些年来,随着互联网的日渐普及和大数据时代的到来,使类......
蒙古文古籍是研究蒙古族历史文化的重要资源,为了加强对蒙古文古籍的保护,提升蒙古文古籍在研究中的利用率,越来越多的蒙古文古籍......
不平衡数据集中不同类别的样本之间分布不平衡,且数目相差较大,其广泛存在于网络入侵检测、癌症检测、垃圾邮件分类等各个场景中。......
不平衡数据广泛存在于现实生活中。在这样的数据集中,数量上相对稀少的少数类本数据往往是人们所特别关注的重点。在不平衡数据中,......