不平衡数据分类算法研究及应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:popok12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际生活中,许多领域都存在数据不平衡问题,而机器学习算法设计大多是基于均衡的数据,在处理不平衡问题时容易将少数类误分为多数类。数据不平衡问题使得机器学习算法在落地应用时与理论存在一定的差距,是机器学习进行实际应用时需要解决的一大重要问题,学者们针对此问题做了许多研究,并取得了不少研究成果,但还存在一些问题,如类内不平衡、过度拟合少数类等。针对上述问题,本文进行了理论及应用研究,并将所提方法应用在配电网故障停电预测任务中。配电网在日常生活及社会发展中占据重要位置,其信息管理系统已累积了大量的数据,有效利用这些数据实现配电网馈线故障停电预警,从而提前进行运维检修,对提高配电网供电可靠性,保障用户的用电质量有着重要意义。本文具体研究工作如下:在数据预处理层面,大多数文献都未涉及类内不平衡问题的研究,将其统一归类为类间不平衡问题,忽略了类内不平衡对模型性能的影响。因此本文提出了基于聚类的生成对抗神经网络(K-Means-GAN)数据生成方法,平衡少数类样本分布的同时,在一定程度上也降低了数据集整体的不平衡度。在算法层面,学者们常将代价敏感结合其它算法用于不平衡数据分类。代价敏感算法以分类错误总代价为全局优化目标,通过加大少数类的误分类代价提高少数类的召回率,却忽略了少数类的精确率,使得模型过度拟合少数类,将大量多数类样本误分为少数类,造成大量误报。因此本文提出了基于随机代价敏感的卷积神经网络(Random Cost-CNN)分类算法,结合代价敏感思想并引入随机理论,缓解模型过度拟合少数类的问题,提高了模型的泛化性。最后,应用本文所提方法进行应用研究。基于实际生产环境中的配电网故障停电及其相关数据,建立配电网10k V馈线故障停电预警模型,可为电网人员提供辅助决策支撑,及时进行运维检修,提高供电可靠性,对促进国民经济稳定发展、保障用户的用电质量及提升全社会满意度有着重要意义。另外,本文从数据驱动的角度入手,开展配电网数据前期的探索研究,为未来高效合理利用电网数据,进一步挖掘数据价值打下坚实的基础。
其他文献
在线、实时的动作模式识别对于新型人机交互(Human-machine interaction,HMI)具有重要意义。由于表面肌电(Surface electromyography,sEMG)信号相较于其他传感信号,具有提前于人体动作产生这一特性,可以极大地提高动作识别的实时性,因此在康复医学与人机交互领域被广泛关注。然而,sEMG信号本身具有混沌、非平稳与非周期等性质,导致在非稳定、时变的在线应用
学位
将“耕地变化驱动力”研究作为目标领域,从中国知网数据库和外文学术期刊数据库Web of Science(WoS)分别筛选出585篇和296篇文献,利用文献归纳法和CiteSpace对目标领域的中外文献进行对比分析。结果表明:(1)中外文献时间分布大致可分为两个阶段:1999—2010年,中外文献数量分别呈现快速增长状态、缓慢增长状态;2010—2020年,中外文献数量分别呈现波动增长、稳步增长状态
期刊
当脑血管突然破裂或者由于血管堵塞造成部分血液不能流向大脑时,就会引起脑卒中。没有血液供应,脑细胞会逐渐死亡,进而大脑区域会受到影响并致使残疾。若能早期识别卒中症状,并且及时地进行干预治疗,那么对于提升患者的治疗效果以及减少患者伤残率都有重要的意义。为此本文选取了部分机器学习算法来构建脑卒中预测模型,为预测脑卒中发生风险设计了一个优异的框架,用以辅助医生进行诊治决策,期望能最大化实现对患者病情的早期
学位
作为粮食生产最基本物质条件的耕地,通过其功能的发挥源源不断为我们提供粮食作物,因此,保护耕地是确保粮食安全的逻辑起点。但当前以《土地管理法》为中心架构的耕地保护制度中,仍有诸多束缚粮食安全实现的困境,诸如对耕地保护目标存在认知和导向的不足,耕地保护主体缺位,耕地保护模式相对单一。针对既有耕地保护制度面临的三重困境,亟待推动耕地“三位一体”的全要素均衡实现,推进政府、市场主体和社会主体的协同参与,实
期刊
数字化与智能化是制造业发展的必然趋势,机械臂作为制造业中不可或缺的自动化设备,发挥着至关重要的作用。随着《中国制造2025》等一系列国家指导政策的出台,机械臂的理论研究与行业应用也被推上了新的台阶。现目前,接触式作业在机械臂的目标任务中已变得愈发普遍,例如抛光打磨、工件装配和物体抓取等。这类任务要求机械臂在高精度位置控制的基础上,对与外界环境的接触力进行精准控制,使机械臂处于柔顺状态。为了实现接触
学位
从材料特性及工作环境等方面,指明了电子束焊接相较于其他焊接方法,可以更好地满足燃气轮机焊接零部件的性能需求。同时结合电子束焊接的特点,从耐高温材料的电子束焊接性能、异种钢的电子束焊接、复杂结构的电子束焊接和其他方面的电子束应用4个方面,对国内外在该领域的基础研究和实际应用进行了分析。简述了电子束焊接在各研究方向的发展历程,阐明了电子束焊接在燃气轮机零部件焊接过程中的优势,并提出了各研究方向需要进一
期刊
作者系统研究了中国小卷蛾族标本,发现了五个新种:(1)曲茎小食心虫GrapholitacurviphalaLiuetYan,因其雄性外生殖器阳茎长而端部弯曲命名,分布在四川峨眉山;(2)顶平小食心虫G.globelaLiuetYan,因其雄性外生殖器的抱器顶端平截而命名,分布在吉林长白山;(3)手指小食心虫G.dactylaLiuetYan,因其雄性外生殖器的抱器腹有手指状突起而命名,分布在广东广
期刊
为探究不同燃料、环境温度对微型燃气轮机联合循环运行性能的影响,利用MATLAB/Simulink软件建立回热型微型燃气轮机联合循环模型,以天然气为燃料,验证模型的合理性。选取天然气、沼气和松木气等作为燃料,在环境温度为15℃,机组的输出功率为100 kW时,与天然气系统相比,沼气和松木气系统的燃料流量增大,燃烧室出口温度降低,电效率分别下降了0.19%和0.67%,联合循环热效率分别下降了0.22
期刊
[目的]基于当前耕地“非粮化”整治工作情况,分析整治成效、面临困难与存在问题,提出耕地“非粮化”整治优化方略,推动耕地“非粮化”整治工作稳妥有序进行。[方法]文章主要采取文献分析和政策文件解读方法。[结果]国家出台了一系列防止耕地“非粮化”政策,各地启动耕地“非粮化”整治行动,有效抑制耕地“非粮化”,扭转耕地面积大幅减少的局面;同时,耕地“非粮化”整治也面临一些困难,出现急于求成,一刀切等问题,经
期刊
磁耦合无线电能传输(Magnetic Coupling Wireless Power Transfer,MC-WPT)技术通过高频磁场耦合的方式实现电能的非电气接触传输,具有便捷、安全、环保和易维护的优点,受到国内外众多专家学者的关注和研究,相关的研究成果在国民经济的多个领域得到广泛的应用。随着无线电能传输技术的进一步发展,MC-WPT技术应用场景也越来越多样化,进一步对MC-WPT系统的能效性和
学位