基于欠采样的不平衡数据分类问题的研究

来源 :湖北大学 | 被引量 : 0次 | 上传用户:liuyongqing0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在故障检测、肿瘤检测、人脸识别等机器学习领域中,数据往往是不平衡的。欠采样方法是解决不平衡数据分类问题的一种重要方法,虽然在处理大规模数据时具有一定优势,但存在信息损耗、易受类重叠、噪声影响等问题。因此,本文将集成学习和马氏选择性抽样应用到欠采样中,提出了两个方法:基于自调节权重的集成方法和基于线性判别分析的马氏欠采样方法。本文主要研究内容和创新点如下:(1)针对欠采样方法存在信息损耗等问题,本文提出了一种基于自调节权重的集成方法。该方法首先根据预分类得到的绝对值损失设计了一种基于概率的欠采样策略。然后,该方法对欠采样后得到的基分类器进行加权,并生成集成分类器。基于公共数据集的实验结果表明,相比于其他不平衡学习方法,本文提出的方法在F值、G-mean以及AUC等方面具有更好的学习性能。(2)针对欠采样方法易受类重叠、噪声影响等问题,本文提出了一种基于线性判别分析的马氏欠采样方法。该方法首先根据线性判别分析预分类得到的G-mean多次调整分类边界的位置。然后,该方法利用马氏选择性抽样从当前的多数类中抽取重要的训练样本。基于公共数据集的实验结果表明,相对于其他不平衡学习方法,本文提出的方法在F值、G-mean以及AUC等方面具有更好的学习性能。
其他文献
铁硫簇是生物体内存在的最古老的的物质之一,普遍存在于生物体氧化还原系统中,在生物体内起着举足轻重的作用。不同的铁硫蛋白包含不同的铁硫簇,承担着电子传递、氧化还原反应、催化中心、铁和氧的感应器、维持DNA稳定、蛋白质翻译、能量转换等多种功能。铁硫簇种类繁多,最常见的为[2Fe2S]、[3Fe4S]和[4Fe4S]。铁硫簇虽然结构简单,但其组装的过程复杂,包含多种不同的组装途径。目前,在自然界中已经鉴
学位
大冶作为一个因矿而生,因矿而兴的资源型城市,经过几千年的人工采冶活动,积累了深厚的矿冶文化。矿冶文化是工业文化的主要类型之一,它是人类利用自然矿产资源,在环境中留下了一系列文化现象的综合体,矿冶文化是人类工业发展过程中所有行为的动态展现。大冶的矿冶文化中所体现“愚公移山”的敢想敢干精神、“抚夷属夏”的包容创新精神、“舍身为国”的爱国情怀,都对我们后辈有着深远的启示。而大冶铜绿山古矿遗址博物馆则是矿
学位
随着时代的发展和科技的进步,不断地衍生出一些新材料、新思想、新传播方式。这些能够促进水彩画发展的新产物,我们都可以统称为“新媒介”。艺术家们逐渐改善传统媒介的缺陷,将新媒介融入当代水彩艺术之中。本文通过探索新媒介种类、分析新媒介对水彩画创作的影响,让我们更深入的认识和理解新媒介,更好的让新媒介为水彩画创作服务。文章从传统媒介的束缚、新媒介的应时而生、新媒介的应用特征以及新媒介对水彩画创作的影响,这
学位
税收是我国财政收入的主要来源,落实好税收政策就相当于稳固了国家经济。减税降费政策基于2015年提出,具体到2019年落实。如何落实好政策也成为了税收事业的重点。随着互联网技术的快速发展,税务结合互联网模式在国内已经应用得越来越广泛,对于减税降费这种近几年提出的新政策,需要良好的税收管理机制,这样不仅可以提升税务人员在处理风险时的效率,也能减轻税务人员核对风险数据的负担。目前的减税降费税收管理机制有
学位
我国海洋面积广阔,海洋资源丰富。近些年来,在海洋强国战略与海洋权益保护大力推行的背景下,声纳系统技术作为一种重要的探测手段得以迅速发展。如今探测与侦查声纳对大孔径、远距离探测需求和多波束与图像声纳对高分辨率、高作业效率的需求日益加大,因此水听器阵列的规模也越来越大。与此同时,对水听器采集传输系统的工作载体在尺寸、安装环境等方面提出了新的紧密型要求,其中便包含类似瓦片型的微薄型工作载体。因此,设计一
学位
随着城市空间步入了从增量变为存量的阶段,日积月累形成的城市公共空间环境问题开始逐渐显现,在国家"十四五规划纲要"战略提出的加快推进城市更新政策以及业界从业者的行动中,城市公共空间微更新也逐渐得到了重视,其中渐进式的空间微更新已然成为了城市更新的主要模式。通过对当前的城市微更新的历史发展背景加以分析可以发现,大多采用的是以公共艺术或公共参与为指导的局部更新方法,但依旧存在许多亟待解决的问题。本文通过
学位
我国城市在增量发展的过程中遇到了诸如空间结构、治理方案和整治工作等方面的难题,在转向存量发展的过程中,需要进一步审视相关城市问题,而空间正义在空间生产和空间资源配置中所反映的公平效率正是解决城市问题有效的评价标准。本文以旧城更新为背景,以空间正义为视角,分析出城市空间存在着空间挤压、空间异化、空间隔离和空间逃逸等空间非正义现象,总结出价值失效、德性失效、情感失效和规范失效四个层面的伦理失效原因,并
学位
随着科学技术的快速发展,越来越多的信息涌进互联网,面对严重的信息过载,人们急需一种在短时间内过滤信息的手段,以获取更多感兴趣的内容。因此,推荐系统得到了迅速的发展。尽管目前有大量的关于个性化推荐的研究,但是现有的研究一般是根据用户与物品的交互历史进行推荐的,没有充分利用用户与物品的信息,如相关常识,领域知识等。知识图谱将用户与物品的交互记录与候选物品的信息在知识级别上联系起来,对推荐系统的信息进行
学位
传统外部裂纹的检测方法主要包括人眼识别、涡流、射线、电磁、渗透、微波等检测方法,这些方法主要是利用物质的物理性质进行裂纹检测,大部分方法虽发展成熟,但同时也存在明显的不足,如人工检测耗时费力,涡流检测极易受到干扰等。基于深度学习的裂纹检测方法是现在主流的裂纹检测方法,并且已经极大地提升了裂纹检测的效率,但考虑到裂纹主要位于图像的高频部分,所以和对源图像进行处理相比,直接将高频特征信息作为深度学习模
学位
随着“十四五”开局,我国文化旅游产业走向高质量发展道路,传统以景区门票收入为主要经济来源的旅游发展模式不足以应对当下文旅融合发展的需要,开发数字创意产品可以有效为景区发展提供支撑,帮助景区脱离单纯依赖传统资源的限制,实现产业转型。在消费群体主体变更的大环境下,旅游景区所要提供的服务也需要转向文化科技体验多方融合的全域旅游模式。通过数字创意产品促进景区发展的机制研究,得出数字创意产品可以从产业、营销
学位