【摘 要】
:
在现实生活中,存在大量的样本类别不均衡数据,比如信用卡欺诈数据、罕见疾病数据等。基于不平衡数据的分类,称为不平衡分类,分类器倾向于学习多类样本的特征而忽视少类样本的
论文部分内容阅读
在现实生活中,存在大量的样本类别不均衡数据,比如信用卡欺诈数据、罕见疾病数据等。基于不平衡数据的分类,称为不平衡分类,分类器倾向于学习多类样本的特征而忽视少类样本的特征,导致所训练出的分类器易将样本都预测为多类样本,难以识别少类样本,而少类样本往往具有重要价值。现有的解决不平衡分类问题的方法,主要分为两个方面:数据层面和算法层面。数据层面的方法,通过对不同类别的样本数量进行更改,使得数据集中各类别的样本数量变得相对平衡;算法层面的方法,通过增加少类样本的权重,提高分类器在训练过程对少类样本的重视程度。本文提出一种新的数据层面的方法。将生成对抗网络(Generative Adversarial Nets,简称GAN)从图像等非结构化数据迁移到支付风险数据等结构化数据,以GAN的变种WGAN-GP作为数据增强模型,增加少类样本的数量,使得样本类别达到平衡,以解决结构化数据不平衡分类问题。为验证本文所提方法的有效性,本文使用真实的用户支付行为数据进行验证,并采用Precision、recall(TPR)、TNR、F-measure、G-mean等五个指标作为不平衡分类的评价指标,对所提算法的性能进行度量。同时,采用传统不平衡分类中的SMOTE算法、Bootstrap算法作为对比实验。实验结果表明:本文所提的方法,相比原不平衡数据集,所训练出的分类器的性能有一定提升;与SMOTE算法、Bootstrap算法相比,本文所提方法能够在提升对少类样本的识别能力的同时,保证多类样本的识别精度不下降。
其他文献
摩擦阻力总是和我们的日常生活息息相关。例如我们生活中经常接触的飞行器、铁路列车、轮船等运载工具,其运行中消耗的能量中的相当一部分用于在湍流边界层中克服摩擦阻力,如
熔融塑化是挤出机的核心功能,很大程度上影响挤出制品质量和设备加工能耗。研究高效熔融塑化技术是聚合物加工成型领域的迫切需求。与传统螺杆挤出机不同,单轴偏心转子挤出机
胶粘接技术是微装配的重要组成部分,广泛应用在微电子器件连接固定、LED封装、微型制造等领域。随着微机电系统(MEMS)的迅猛发展和机械电子产品的微小化,对胶粘结技术提出了
铝酸盐玻璃的红外截止波长可达6μm,优于硅酸盐玻璃的4.5μm,其次铝酸盐玻璃的杨氏模量高达112GPa,远超过石英玻璃的68.9GPa,优异的红外透过性和力学性能使得铝酸盐玻璃作为
这些年,随着互联网的快速发展,移动互联网设备的普及,人们的生活到处充满着多媒体信息。HEVC技术标准已经能基本满足现在人们对多媒体信息的传输需求,但是随着5G网络的商业普
近年来,随着各行各业的发展,出现了各种资源的短缺现象。资源短缺现象多产生于云系统、电力系统、无线网络通讯、经济市场中。资源分配问题就是研究如何将资源合理的分配给智能体用户。由于社交网络是一种常用于发布信息、交流互动、共享资源的公共平台。通过吸引更多用户的参与,使得社交网络规模不断扩大,改变了社交网络中的信息传播方式,将人们从被动的接受信息方式转变为人为主动创造信息的方式。因此本文将资源分配问题与社
在对工业控制系统进行建模时,由于不可能考虑到所有系统动态,且对系统参数测量时都会存在相对误差,再加上动态系统模型中都或多或少带有一些不确定因素,这些不确定因素会在一定程度上影响我们对系统性能的分析,甚至可能会误判系统的稳定性。执行器是控制器的重要组成部分,是控制器驱动被控对象的元器件,但是执行器在输入达到一定的限度之后,对系统的输入信号就不再产生响应,这就是执行器的饱和特性。饱和特性是强非线性的一
石墨烯材料由于其超高的本征强度、理论比表面积、电导率以及导热系数等优异性能,在过去15年中已成为国际瞩目的研究前沿和热点之一。然而,如何将微观结构单元固有的优良性能
迄今为止,融资融券业务已在我国证券市场上运行近九年多,各方面都取得了长足的进步,这对发展和完善我国资本市场起到了积极促进作用。然而社会各界对融资融券交易机制是否能抑制我国证券市场资产价格泡沫的看法并不一致。一方面,融资融券制度作为一种金融创新工具,对提升市场资源配置效率及优化证券交易质量都具有十分积极的作用。在抑制资产价格的泡沫的同时,该制度还可以提升市场活力,降低股价的波动程度,达到稳定证券市场
足球是世界上最受欢迎的体育运动,并对国家的经济和社会产生影响。像其他国家一样,阿尔及利亚对发展足球事业感兴趣,并试图达到尽可能高的水平。这也是本学位论文讨论阿尔及利亚足球历史发展研究。本研究分为三个部分:导言、理论及应用。导言中讨论了本课题的研究问题,即:“从阿尔及利亚足球的历史中获益,是否有助于其未来的发展?”从这个问题中,总结出以下部分问题:1.缺乏对运动员及教练员有价值的训练,是否会导致阿尔