基于邻域混合抽样和动态集成的不平衡数据分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:xjk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据严重影响了传统分类算法的性能,导致少数类的识别率降低。提出一种基于邻域特征的混合抽样技术,该技术根据样本邻域中的类别分布特征来确定采样权重,进而采用混合抽样的方法来获得平衡的数据集;然后采用一种基于局部置信度的动态集成方法,通过分类学习生成基分类器,对于每个检验的样本,根据局部分类精度动态地选择最优的基分类器进行组合。通过UCI标准数据集上的实验表明,该方法能够同时提高不平衡数据中少数类和多数类的分类精度。
其他文献
针对某导弹发控仪模拟器实时控制电路集成度低,难以提高性能的问题,提出了基于AT89C52单片机实时系统的设计方法;分析了导弹发控仪模拟器计时电路的功能和原理,介绍了AT89C52单片
多级节流智能控制系统是一套复杂的机.电、液一体化系统,涉及多项技术,其中最关键的技术是应用计算机对井控节流阀压降的实时控制;系统采用计算机电液比例闭环控制,通过研究建立了
为改变目前轮对检测的落后现状,及时准确掌握轮对运行状况,研制开发了一套轮对参数非接触自动检测系统.针对该系统中由多传感器及系统标定值融合处理而产生的多误差源,进行了
为了突破了像元间隙给测量精度带来的限制,提出了一种利用低分辨率面阵CCD实现高精度边缘检测的方法,其实质为运用插值方法对输入图像放大细化,再进行模糊处理,处理的结果显现出更丰富的边缘信息,利用动态算子对其进行边缘提取,以计算出被测弹丸的精确边缘位置信息;经实验证明,该方法能很好地恢复弹形,并较好地计算出弹丸的攻角参数。
采用8位及16位微处理器已经在很多场合下不能满足我们的性能需求,尤其汽车的制动系统的实时性要求.使得采用能够充分并且合理利用CPU的高性能32位微处理器成为设计汽车电控单元
目的明确2种亨廷顿蛋白相关蛋白1(huntingtin-associated protein 1,HAP1)异构体—HAP1A和HAP1B在大鼠脊髓灰质内的分布特征。方法提取重组表达的谷胱甘肽S-转移酶(GST)-HAP1AC末
目的研究整合素β1在CD151促脐静脉内皮细胞迁移增殖中的机制。方法通过构建PAAV-CD151质粒及其pAAV-CD151-AAA^194-196突变体(QRD)并转染HUVEC,HUVEC分为正常对照组、绿色荧光
为推行自主式保障理念,提高电子装备的综合保障能力,提出了一种基于视情维修的电子装备预测与健康管理(Prognostics and Health Management,PHM)构建方案。在分析PHM内涵和功
目的探讨herg1基因及其表达的HERG1蛋白在胃癌中的表达情况,研究其与胃癌间的相关性。方法应用免疫组化方法(SP法),RT—PCR技术及Westernblot方法对64例胃癌组织标本及对应正常胃
工程实践对数据采集系统提出了越来越高的要求:大动态输入范围、高精度、自动控制等;文章分析了影响数据采集系统性能指标的两大主要因素:ADC转换位数和ADC模拟信号输入的动态范