基于样本混合技术的类别不平衡图像分类算法研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:chenbenxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的快速发展,性能强大的深度学习模型已经被广泛地应用到如计算机视觉、自然语言处理、智能语音等在内的各个领域当中。在基于深度学习技术的应用场景中,大规模数据集是确保深度学习模型性能必不可少的一环。然而,现实的数据往往会存在着类别分布不平衡的问题。在训练过程中,样本稀少的类别容易被模型忽视,从而损害模型性能,导致训练出来的模型性能不及预期。因此,如何利用类别分布不平衡的训练样本进行有效的学习,成为近年来备受关注且迫切需要解决的研究问题。本文以图像分类任务为基础载体,对类别不平衡图像分类问题进行研究,并从Mixup数据增强技术的数据层面角度探讨相关解决方法,提出了包括Mixup联合重采样的图像分类方法以及基于图像切块混合的图像分类方法。本文首先提出了基于Mixup联合重采样的类别不平衡图像分类方法。该方法通过分析过采样方法和Mixup数据增强技术之间的互补性,进而提出一个结合基于实例采样(Instance-based Sampling)和基于类别采样(Class-based Sampling)的混合样本方法来解决类别不平衡图像分类问题。该方法引入重采样的思路,首先平衡各个类别的标签占有率,再进行样本混合操作,从而有效减少噪声样本生成。此外,该方法进一步提出一种混合权重衰减策略,根据训练周期数自适应地调整双采样器之间的混合比重,进而指导网络模型的学习。在该策略的作用下,训练前期基于实例采样的权重较大,帮助模型建立起基本的表征能力;随着训练的进行,混合权重逐渐由类别采样所主导,在具有一定的表征能力的基础上,进一步引导模型关注稀少类别的学习。所提方法通过权重衰减策略有效地结合了两种不同性质的采样方式,充分利用了两种采样方法各自的优势来训练网络模型,通过调整混合权重完成模型从表征学习到重平衡学习的转变,进而显著提高了类别不平衡图像分类准确率。本文随后继续对Mixup样本混合技术进行深入探讨,分别从混合方式和样本分布的角度出发,提出了基于图像切块混合的类别不平衡图像分类方法。该方法分别包含图像切块混合模块和训练样本选择机制模块。图像切块混合使用图像间的矩形块裁剪粘贴替代原始的线性加权混合,该方法认为图像间的切块混合能让模型更加清晰地学习图像块之间的局部特征,解决了线性加权混合带来的特征模糊问题。此外,针对图像裁剪还提出了一个自适应方框位置调整方法,确保了裁剪区域的准确性。训练样本选择机制根据混合样本中图像块所占的比例,选择性地替换部分的混合样本,在混合样本中引入原始样本进行训练。最后,该方法还与常见的重采样和重加权技术进行有效集成,从而进一步地提高类别不平衡图像分类的准确率。本文主要有以下贡献:(1)本文首先关注到Mixup数据增强技术在类别不平衡场景下的局限性,进而提出一个基于Mixup联合重采样的方法有效地减少混合过程中噪声样本的生成;同时提出一种混合权重衰减策略用于指导模型训练,仅通过调整混合样本分布帮助模型逐步关注稀少类别的特征。(2)本文分析线性插值和图像切块两种混合方法表现出的性能差异,首先提出用于类别不平衡图像分类的图像切块混合方法,该方法能显著提高混合样本的特征表达能力;其次,本文将图像切块混合方法与经典重采样、重加权技术进行有效集成,进一步提高模型在类别不平衡场景下的图像分类性能。
其他文献
铀矿物是铀矿床勘探与选冶的重要研究对象。相山铀矿田是我国最大的火山岩型铀-多金属矿田,主要发育有早期碱交代和晚期酸交代两期铀矿化,但目前对这两期铀矿化中铀矿物的地球化学特征尚缺乏系统的对比研究。文章运用电子探针和激光剥蚀电感耦合等离子体质谱对相山铀矿田两期铀矿化矿石中铀矿物稀土元素特征进行研究。结果显示,相山铀矿田碱交代和酸交代型铀矿化矿石中铀矿物类型均包含钛铀矿、铀石和沥青铀矿,碱交代型铀矿化矿
期刊
环烯醚萜类成分为广泛分布于中药中的次级代谢产物,经常出现在龙胆科、唇形科、茜草科、玄参科中。由于它是一种结构为半缩醛及环戊烷的单萜类化合物,所以性质不稳定,以苷类形式存在于植物中。环烯醚萜类成分因其特殊结构和多元药理活性,广泛应用于临床抗肿瘤、抗炎、降血糖等方面研究。重点分析环烯醚萜类成分生物合成途径以及其关键酶基因,以期为深层次挖掘环烯醚萜类功能基因以及生物合成途径解析提供参考。
期刊
神经胶质细胞瘤发源于神经上皮组织,其中绝大多数是恶性。神经上皮来源的肿瘤在成年人原发性颅内肿瘤肿占据较高的比例,据统计约为50-60%。发病率从高到低进行排列可以分为:星形细胞瘤、少突神经胶质细胞瘤、室管膜瘤和髓母细胞瘤。WHO根据肿瘤的恶性程度,神经胶质瘤分为I级(低增殖能力、低侵袭性的星形细胞瘤和少突胶质细胞瘤)到IV级(高侵袭性、核分裂活跃、易坏死的胶质母细胞瘤)。针对恶性胶质瘤,目前首选的
学位
目的:上海市长宁区一项社区严重精神障碍患者家属的监护状况横断面调查显示,人口快速老龄化可能逐渐降低家庭继续承担患者监护的能力。严重精神障碍患者及家属均呈现老龄化趋势。在严重精神障碍患者及家属这样的特殊群体中,家属躯体、心理状况差、监护能力不足等问题是目前需要解决的严重精神障碍患者的家属监护能力问题。通过检索国内外文献发现,对严重精神障碍患者的家属提供一定的心理支持服务,大多停留在现况研究上,通过某
学位
背景:目前系统临床病例的诊断中女性患者在尿道恶性肿瘤方面的发病率明显要高于男性患者,其比例可约4:1左右。远端尿道恶性肿瘤可以行远端尿道部分切除术,但是女性尿道较男性短,据报道其术后复发率高。影响因素中目前所知的考虑主要包括以下几个情况:患者术前自身尿道的长度情况(尿道的长度)、肿瘤的大小、肿瘤生长位置、肿瘤术后或活检病理分型程度和手术方式等因素(切除肿瘤边缘尿道的长度)。尿道癌本身是一种较为罕见
学位
尿路感染(Urinary tract infections,UTIs)是泌尿系统常见的感染。流行病学数据显示,在感染性疾病中UTIs的发病率仅次于呼吸道感染,居第二位。女性由于解剖学特点,特别容易罹患UTIs,大部分女性一生至少经历过一次UTIs。并且部分患者的UTIs容易反复发作,因此经常反复就医并需长期交替服用各类抗菌药物,容易诱导临床耐药菌株的产生及传播。以往的研究认为引起UTIs的致病菌起
学位
神经损伤尤其是脊髓损伤后脑功能重塑研究是近年来国内外研究的热点,有研究发现脊髓损伤后大脑相关功能区会逐渐退变甚至被相邻功能区侵占,也有研究得到相反结果,大脑并没有出现退变反而出现功能重塑。脊髓损伤后究竟是什么机制调控大脑退变或功能重塑目前还不清楚。本课题组前期研究证实脊髓损伤后可利用损伤平面以上正常的神经根前后根移位和支配膀胱的骶神经前后根吻合同时重建膀胱的传入和传出通路,且术后大脑的储尿排尿相关
学位
男性下尿路症状(Lower Urinary Tract Symptoms,LUTS)是泌尿外科最常见的一大类疾病,2008年全球约有LUTS患者9.3亿,2013年增至10.2亿。其发病率和严重程度随着年龄的增长呈现上升趋势。男性下尿路症状病因复杂,相当一部分患者很难在短时间内诊出病因,因此,临床诊疗思路亦随之发生转变[1]。孙颖浩院士在全球率先提出了男性下尿路症状诊疗的“3B”思维,一是建立以B
学位
党的十八大以来,党中央和政府围绕绿色发展的主题对生态环境保护治理推出了一系列举措。其中,流域生态补偿机制作为我国流域治理的创新措施,被广泛应用于我国各大流域,并初见成效。但随着流域生态补偿机制在全国范围的推广实践,诸如政策不够完善、制度不够成熟等问题也逐渐暴露,对此,本文梳理了流域治理的现状,分析了流域生态补偿机制的现存问题,从完善立法、优化机制内容等角度提出了相关的建议,为推动流域生态补偿机制在
期刊
第一部分大脑中动脉动脉瘤介入治疗预后的系统综述及Meta分析研究目的:近年来介入技术及介入材料得到快速发展,但对大脑中动脉动脉瘤的治疗首选依然存在争议,而争议的核心在于介入治疗的总体的安全性和有效性仍不明确。因此,我们对近年来大脑中动脉动脉瘤介入治疗的相关文献进行了系统综述及Meta分析,以了解目前大脑中动脉动脉瘤介入治疗的总体预后。研究方法:对2000年1月至2017年12月Pubmed、Emb
学位