极限学习机在类不平衡学习中的应用研究

来源 :江苏科技大学 | 被引量 : 3次 | 上传用户:candle819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类不平衡是数据挖掘领域的十大难题之一,在学术界和产业界备受瞩目。所谓类不平衡是指样本数据中某一类的样本远多于其它类样本,从而造成传统分类模型的分类面偏倚,导致分类性能下降的问题。经过多年研究,多种解决类不平衡问题的方法已被提出,但其并未充分研究样本先验分布对分类性能的影响。针对上述问题,本文基于代价敏感学习的思想,充分研究了类不平衡问题对分类器性能的影响,以耦合样本的先验分布信息为出发点,对二类及多类不平衡分类问题、一类分类问题分别展开研究。主要研究内容包含以下两个方面:1)在两类及多类不平衡分类问题中,传统分类器的分类面往往偏向多数类,导致少数类预测准确率下降。针对此问题,本文提出了耦合样本先验分布信息的加权极限学习机CPWELM(Coupling Prior distribution Weighted Extreme Learning Machine)算法。以极限学习机为基分类器,拟从样本的先验分布如类不平衡比例、类覆盖区域大小、噪声点及离群点等探讨不同分布对分类性能影响,并耦合这些信息以构造代价矩阵,以提升分类器性能并使算法在不同分布上具有鲁棒性。通过46个二类及多类不平衡数据集,分别验证了CPWELM算法的可行性及有效性。结果表明,相比于同类算法,CPWELM算法的性能更优。2)一类分类问题是类不平衡问题中的极端情形,即数据集中少数类样本难以获取或者几乎不存在的情况,使得训练集仅有目标类,对应应用如异常检测,新颖性检测等。针对传统一类分类器分布适应性差、数据描述不够精确等问题,本文提出了基于K近邻相对概率密度估计的模糊一类极限自编码器FOCEAE(Fuzzy One-Class Extreme Auto-Encoder)算法。在模糊极限学习机的基础上,采用K近邻对数据分布的全局相对概率密度进行估计,进而对样本进行模糊加权操作,从而实现对样本的精确描述。特别地,极限学习机以自编码器的方式实现,并通过重构误差来确定样本类属。实验结果表明,与诸多传统方法相比,本文算法不但具有更好的数据描述能力,而且兼具运行时间低的特点。
其他文献
本文结合中国梅山文化园实际案例,通过对材料本体的属性分析,探讨梅山文化园材料建构同地域文化之间的关联性。梅山文化是一种具有鲜明特色的地域性民族文化,它生动地反映了
我国是鳗鲡养殖大国,但细菌性疾病危害严重,创伤弧菌和迟缓爱德华氏菌是导致鳗鲡疾病的主要病原,研究针对这两种菌的疫苗具有潜在的应用价值。传统疫苗的灭活疫苗毒性较大,同
党的十九大首次提出实施乡村振兴战略,实施乡村振兴战略,是新时代贯彻新发展理念的重大战略,也是全面建成小康社会、实现社会主义现代化的重大方针政策。同时强调,建立健全城乡融合发展体制机制以及构建相关的政策体系,是实现乡村振兴的重要途径。坚持乡村振兴和城乡融合发展的有机统一,这是做好新时代农村农业农民工作的关键所在。在实施乡村振兴战略的视域下研究我国新时代城乡融合发展,是着眼于我国城乡发展不平衡、全面建
随着全球能源危机的加剧,生物柴油因具有环保、清洁、可再生等优点越来越受国内外关注。我国人多地少,为确保粮食安全,政府禁止用粮食作物来生产生物柴油。因此,由于原料的限
抗菌肽(Antimicrobial peptide,AMP)是广泛分布于细菌、真菌、病毒以及各类动植物体内的一类具有天然抗微生物活性的物质,是生物体天然免疫防御系统的重要组成部分。其中,哺
这篇文章的研究目标是在Apache Spark平台上实现权重张量近似法(Weighted Tensor Approximation,WTA),同时使得张量压缩时间尽可能地短。与一般张量近似法(Tensor Approximat
计算研究敏化染料的电子结构和光学性质。其中,结构优化基于溶剂化PCM模型,以氯仿为溶剂,采用密度泛函B3LYP/6-31G(d,p)方法计算得到;吸收光谱则在CAM-B3LYP/6-31G(d,p)水平
工业信息物理融合系统(Industrial Cyber-Physical System,ICPS)是工业生产实现智能制造转型的重要技术。无线Mesh网络是一种在ICPS中被广泛应用的新型网络技术,具有部署方式灵活、部署成本低以及支持无线终端泛化接入等网络特点。由于工业制造过程存在多源干扰、通信链路脆弱、节点可靠性受影响等问题,无线Mesh网络性能在实际的工业场景中受到较大的挑战。针对上述问题,本文
随着社会经济的发展和人民物质文化生活水平的不断提高,饮食文化方面,人们正不断从“温饱”向“安好”转变,“食以安为先”的观念已悄然在人们心中生根发芽。然而,现代经济市场中不断曝发的重大食品安全事件,以及其背后隐藏的严重食品犯罪行为,一时间,在社会上引起了极度的恐慌,使人们不得不开始对食品的安全产生巨大的担忧。为此,我国《刑法修正案(八)》专门对食品安全犯罪进行了全面的修改完善,目的就是希望通过从严惩
随着“国培计划”进入中后期阶段,教师工作坊更是出现了“遍地开花”的发展趋势。在“互联网+教育”的时代背景下,教育信息技术的发展及相关政策文件的出台,促使了我国中小学教师研修形式出现显著变化,网络研修与校本研修相结合的混合式研修已经成为新常态。近年来,面对全新技术变革与研修培训理念的深入发展,教师工作坊促进了教育教学质量的提升,推动了基础教育的均衡发展,但在现阶段的实践过程中,仍然存在部分问题:第一