基于抽样和规则的不平衡数据关联分类方法

来源 :系统工程理论与实践 | 被引量 : 0次 | 上传用户:yjq360124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据的出现给传统关联分类算法带来了巨大的挑战.为了提高关联分类方法对不平衡数据集的分类精度,本文分别从数据和规则层次着手,提出了关键值抽样法(key value sampling,KVS)和规则验证法(rule validation,RV).关键值抽样法通过增加与少数类相关性强的数据,减少与多数类相关性弱的数据来达到数据类分布平衡.避免了大量有效信息的流失,并且增强了与少数类相关性强的数据信息.规则验证法对初步生成的分类器进行了规则验证,并对分类性能不好的规则进行调整,从而保证了分类器中规则的质量.实验表明,本文中的研究方法能够有效提高关联分类方法处理不平衡数据的精度.
其他文献
在分析汴京虹桥的基础上 ,将叠梁拱桥扩充到钢筋混凝土结构和钢管结构 ,并结合实例进一步对单孔叠梁拱桥的构造、设计、计算和施工作了研究 Based on the analysis of Beiji
2010年5月26日晚8点,蓉园宾馆一号楼灯火通明,这栋曾经接待过毛泽东等党和国家领导人的神秘府院的大门徐徐打开,一位精神矍铄的老人在众人陪同下,下榻于此。他,就是共和国的
<正> 开普勒行星运动第三定律主要内容是:各个行星绕太阳公转周斯T的平方正比于行星椭圆轨道半长轴a的立方,且它们的比值为一恒量。下述是该定律的一种简单推导
将葡聚糖用NaIO4氧化成带醛基的产物,再与人血清蛋白(HSA)中的氨基反应形成不稳定的席夫碱,在还原剂硼氰氢化钠(NaCNBH3)的作用下,成为稳定的拟糖蛋白抗原,并对影响偶合反应的几
通过对中华民族优秀传统文化融入"中国近现代史纲要"教学机制的构建及其实践,在导入中华民族精神的传统文化时,借助地方历史资源做为融入载体,运用这种具化的物质、精神文化
<正> 二十六年前,著名戏剧家田汉同志以生花之笔血肉丰满地再现了十三世纪梨园领袖关汉卿的光辉形象。众所周知,关汉卿的名字和作品人们很熟悉,而关汉卿的生平却了解得非常少
阐述了研究和开发煤气化技术的重要意义,详细介绍了目前国内外主流煤气化技术的进展及应用,比较了各种煤气化技术的优缺点,并对如何选择煤气化技术提出了自己的看法。
苏州话的俚词俗语,很多记录的都是苏州人的生活,很大程度上反映了苏州一这个具有两千五百多年历史的古老城市的民俗、社会面貌和风土人情;人们口耳相传的俚词俗语也是方言词
背景:骨代谢过程中,成骨细胞的数量和功能的变化影响骨的生物学特性,外泌体能够通过细胞间的传递进行信号传递,具有促进细胞增殖、分化的潜能。目的:探讨骨质疏松大鼠血清中
赛络纺精梳棉纱与韩国晓星氨纶通过不同纱线组合及弹力布在不同经纬向的弹性拉伸和弹性回复对比,使全衬弹力布具有良好的弹性拉伸和回复性。从原料组合选择、织造工艺参数设