不平衡学习技术在医疗数据中的应用研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:alanhoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习相关技术的进步,各领域都积极地将这些技术应用到其生产经营的过程中。然而,大多数原始数据中的样本分布是不均衡的,若是使用标准的机器学习算法对不平衡数据集进行分类,会导致最终分类结果产生偏差。因此,人们针对该问题提出了一系列不平衡学习的相关技术。本文在已有不平衡学习技术的基础上,面向小样本量数据的不平衡分类问题提出了基于样本合成的偏差随机森林算法KS-BRAF和基于粒子群优化的KS-BRAF算法(KS-BRAF(PSO)),并将其应用于不平衡的医学诊断数据集的分类任务中。本文首先对原始偏差随机森林算法(Biased Random Forest,BRAF)中在合成关键区域的方法上进行了初步改进。提出的KS-BRAF算法中采用了 K-means SMOTE算法对样本进行合成,该方法既避免了生成的训练数据集信息丢失又有效减少了噪声的生成,从而提高了模型的分类效果。该算法与相关算法在KEEL公开数据集上进行的对比实验结果表明KS-BRAF算法在提高对少数类分类效果的同时又保证了较高的分类精度。随后,为了使KS-BRAF算法的分类性能更加稳定,本文提出了基于粒子群优化的KS-BRAF算法,简称KS-BRAF(PSO)算法。该算法在原始KS-BRAF算法的基础上,通过将K-means SMOTE算法与随机欠采样相结合,并采用粒子群优化算法对过采样与欠采样的样本比例分别进行优化,通过迭代使生成的关键区域数据的分布达到相对最优状态,从而提升算法的分类性能,且文中的大量实验结果也对优化后算法的分类性能进行了验证。最后,本文将KS-BRAF(PSO)算法应用到公开的宫颈癌数据集的分类预测任务中,并与已有研究中用于该数据集分类预测的算法进行对比实验,验证了该算法在该不平衡医学数据集上的分类任务中具有较好的性能,在医学诊断方面能够起到一定的辅助作用。
其他文献
目的:分析超声测量声门下直径在小儿耳鼻喉手术中选择气管导管中临床效果,为超声在小儿麻醉中的应用提供参考依据。方法:选择行耳鼻喉择期手术的小儿患者68例,美国麻醉医师协
Amari动力神经场是研究大脑皮层神经活动的模型,描述的是大规模神经元处于被激活状态时的平均活性,它能够解释很多神经生理学和精神物理学现象,并在实际的运用,如数据聚类、智能机器人等,在如何处理认知等问题中,都取得良好的成果。Amari动力神经场的功能主要由核函数与阈值函数作卷积形成的交互项决定,当所取的核函数和阈值函数不同时,模型的某些性质也是不同的。Amari动力神经场方程存在三种典型的稳态解:
我国的互联网技术在近二十余年的商业化浪潮中,以前所未有的速度引领着社会经济、文化以及生活领域的变革。网络购物是随着互联网的蓬勃发展而新兴的购物方式,近年来网络购物以突飞猛进的速度改变着整个商业格局,使得人们的商业活动超越地理时空等限制,因而对国内城市的实体经济产生了巨大冲击,尤其是大型商业建筑,其传统商业模式的弊端日益凸显。大型购物中心作为人们生活、娱乐、休闲必要的城市空间场所,在城市商业建筑中拥
本研究旨在应我国招生考试制度改革和学业水平考试完善的要求,通过对美国纽约州环境生物学评议考试进行研究以期对我国高中生物学业水平考试命题提供借鉴,研究方法为文本分析
随着现代科技水平的提高,半导体器件性能不断提升,因此被广泛应用于工业、能源、通信等领域。由于环境应力的长期作用,半导体器件的性能容易发生退化,最终发生故障,从而轻则造成电子设备不能正常工作,重则甚至会导致严重事故,因此半导体器件级的性能退化预测对于确保电子设备的可靠性十分重要。绝缘栅双极型晶体管(IGBT)以其低驱动功率、大电流密度等优点,已经成为半导体器件的典型代表。本文以IGBT为研究对象,以
对《历史与阶级意识》的讨论已经成为了马克思主义理论界持续了近一个世纪的经典话题。随着马克思主义文献发掘整理的不断发展,《历史与阶级意识》发表之初的理论界的争论的情况也在逐渐清晰地展现在当代研究者的面前。本文将研究视野置于《历史与阶级意识》发表之初,卢卡奇写作的一篇名为《尾巴主义与辩证法》的手稿上。这是卢卡奇为回应当时关于《历史与阶级意识》的批判而写的,手稿并未公开发表,而是被尘封了近一个世纪后才被
模数转换器(ADC)是连接模拟电路和数字电路的重要接口。随着手机、手环、平板电脑等移动消费电子产品的广泛使用以及新兴的可穿戴设备的出现,高性能、低功耗的ADC已经成为广大模拟电路和数模混合电路领域的研究者们关注的对象和追求的目标。在医疗技术水平飞速发展的今天,医疗设备检测和分析生理信号的能力至关重要,不管是体温计、血压计,还是绘制心电图、脑电图,检测模拟信号依靠传感器,而分析模拟信号的核心单元则是
龙伯透镜是一种满足内部介电常数光滑变化的介质透镜天线,实际工程采用分层结构,属于梯度折射率变化的介质透镜。以高增益,多波束与宽带特性,多使用于卫星与航海通信、导航和防撞雷达等领域。本文针对龙伯透镜的应用进行了相关的研究工作,主要研究内容包括:本文首先阐述了龙伯透镜天线的研究背景和应用场景,展示研究发展过程以及近期的研宄动态。其次,简单介绍基本工作原理以及设计方案,简述几何光学、变换光学和等效媒质的
随着移动互联网的发展,移动智能终端越来越普及,其功能也越来越强大,目前Android系统是移动智能终端上最受欢迎的移动操作系统之一,数据显示,2019年Android手机占国内智能手机出货量的85.1%。同时由于其开放性和可扩展性,Android系统也出现在智能电视、汽车导航系统、家庭自动化系统中,其应用十分广泛、多样,但是这些年来Android操作系统漏洞频发,系统自身的安全脆弱性将直接导致应用
光伏发电在众多新型绿色能源中有着许多优点,如清洁无污染、技术最为成熟、装置结构简单适用推广等。荒漠化地区有着丰富的太阳能资源,光照强、空气湿度低等有利环境条件,为光伏电站的发展提供了得天独厚的条件,但环境条件和其自身性能对其发电量也有一些限制因素,如光伏板温度、入射辐照度和空气中悬浮的沙尘颗粒等因素。因此,如何准确预测光伏模块发电效率是近些年来相关领域众多学者研究的热门课题。入射辐照度的预测已取得