【摘 要】
:
针对传统单个分类器在不平衡数据上分类效果有限的问题,基于对抗生成网络(GAN)和集成学习方法,提出一种新的针对二类不平衡数据集的分类方法——对抗生成网络-自适应增强-决
【机 构】
:
广东工业大学管理学院,香港浸会大学计算机系
【基金项目】
:
国家自然科学基金资助项目(711710);“十二五”国家科技支撑计划项目(2011BAD13B11);广东省海洋经济创新发展区域示范专项项目(GD2013-D01-001)~~
论文部分内容阅读
针对传统单个分类器在不平衡数据上分类效果有限的问题,基于对抗生成网络(GAN)和集成学习方法,提出一种新的针对二类不平衡数据集的分类方法——对抗生成网络-自适应增强-决策树(GAN-AdaBoost-DT)算法。首先,利用GAN训练得到生成模型,生成模型生成少数类样本,降低数据的不平衡性;其次,将生成的少数类样本代入自适应增强(AdaBoost)模型框架,更改权重,改进AdaBoost模型,提升以决策树(DT)为基分类器的AdaBoost模型的分类性能。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在信用卡诈骗数据集上的实验分析表明,该算法与合成少数类样本集成学习相比,准确率提高了4. 5%,受测者工作特征曲线下面积提高了6. 5%;对比改进的合成少数类样本集成学习,准确率提高了4. 9%,AUC值提高了5. 9%;对比随机欠采样集成学习,准确率提高了4. 5%,受测者工作特征曲线下面积提高了5. 4%。在UCI和KEEL的其他数据集上的实验结果表明,该算法在不平衡二分类问题上能提高总体的准确率,优化分类器性能。
其他文献
半表半里初论杨明耀(黑龙江省北安市中医院北安164000)关键词半表半里半表半里是反映病邪深入程度的一种功能损伤定位,它是应用八纲辨证时的一种特殊证候表现特征,也是疾病过程转变的中
<正>力学部分是高中物理每年高考必考的重点内容,且考查时多以力学综合题的形式出现,也就是我们平时所说的物理大题.这类力学综合题条件隐蔽难辨,过程错综复杂,情景扑朔迷离,
<正>广州市高中思想政治新课程实验自从2004年秋季全面启动以来,进展顺利。为总结经验,吸取教训,良性推进新一轮高中思想政治课程改革,我们对全市140多所中学的高三政治教师(
提出了一种双星定位系统(RDSS)无源测距信息与多普勒导航系统(DNS)组合导航的方法。首先对多普勒导航系统的定位误差进行了计算机仿真分析,得到了航姿系统(AHS)的航向角误差是系统主
石膏,味辛、性寒具有清泄邪热之功;银花,味辛微苦,性凉具有清热解毒之能。热痹系痹证中的一个证型,包括西医的痛风在内,系由感受外界湿热之邪,或风寒湿邪蕴久化热,或嗜食辛辣酒酪之品
目的调查北京市社区医务人员对骨质疏松症认知及诊治状况。方法对四家社区卫生服务机构200名社区医务人员进行问卷调查。结果91%社区医务人员从未接诊或很少接诊骨质疏松症患
《伤寒论》开理、法、方、药系统论治疾病的先河,充分体现了中医学辨证论治的精髓。它对痹病的论述为后世痹病理论的发展奠定了基础,认为痹症的病因以外感风寒湿为主,尤其湿
<正>众所周知,学业测试对课程的实施起着重要的导向和质量监控作用。随着课程改革的深入,纸笔测试已成为品德与社会课学业测试的重要方式,许多地区或学校正通过编拟"单元试卷
"阴阳割昏晓"是杜甫《望岳》诗中的句子,历来被认为是极写泰山之高的夸张写法。本文从实际考察出发,以求实精神论证"阴阳割昏晓"是泰山的实有之景,并非夸张之词。
目的:研究罗哌卡因复合舒芬太尼腰硬联合麻醉(CSEA)在无痛分娩中的镇痛效果和对母婴的安全性。方法:回顾性随机选择ASAⅠ~Ⅱ级初产妇100例,分为镇痛组和常规组,每组50例。镇痛组