【摘 要】
:
传统的疾病诊断方法依赖于医生的经验水平和外部环境,误诊则可能带来无法挽回的后果。研究基于机器学习的疾病诊断预测模型,能够辅助提高疾病诊断的准确性,减少疾病诊断成本,减轻医生工作压力。随着疾病种类越来越多以及数据特征越来越复杂,使用单一分类器建立的疾病诊断模型已经不能保证决策的正确性。在机器学习算法中,考虑集成多种技术的方法,进一步提高分类预测模型的分类性能。本文引入动态权重的思想,同时将几种不同的
论文部分内容阅读
传统的疾病诊断方法依赖于医生的经验水平和外部环境,误诊则可能带来无法挽回的后果。研究基于机器学习的疾病诊断预测模型,能够辅助提高疾病诊断的准确性,减少疾病诊断成本,减轻医生工作压力。随着疾病种类越来越多以及数据特征越来越复杂,使用单一分类器建立的疾病诊断模型已经不能保证决策的正确性。在机器学习算法中,考虑集成多种技术的方法,进一步提高分类预测模型的分类性能。本文引入动态权重的思想,同时将几种不同的分类器集成在一起,并针对数据的不平衡改变决策阈值,提出了CELEDAT算法。主要工作如下:使用单一的分类算法很难达到较为满意的分类预测结果,本文基于集成学习的思想,与大多集成学习算法集成同质分类器不同,选择了K近邻算法、决策树、支持向量机和逻辑回归四种不同的分类算法作为基分类器进行集成。针对传统的集成学习算法中确定基分类器的权重后是一成不变的,没有考虑到不同的样本数据与基分类器的适应性不同这一问题。引入动态权重的思想,根据测试样本与聚类得到的类簇的样本相似性以及各类簇与基分类器的权重,为每个测试样本分配不同的权重。对于疾病数据集中的数据不平衡问题,根据不同类别的样本数目,改变决策阈值,更新决策规则,得到最终的预测结果。将算法在UCI数据资源库上的多个疾病数据集上进行实验验证,并对实验结果使用G-mean、AUC、F1分数、正确率、灵敏度和特异度多种指标从多角度去对比分析模型的分类性能。对各种数据集的评价结果,进行了简单的可视化展示,更直观地对比分析各个算法模型的优劣。同时,将CELEDAT算法应用于实际的医学临床项目中,并进行验证。
其他文献
目前国内对于大学校园景观设计的实践活动不断增多,大多集中于校园规划和建筑设计类,然而针对大学校园绿地系统的理论文献相对匮乏。本文以大学理念为指导、生态学为理论依据
近十余年来,应用细胞因子来改善辐射造血损伤获得了良好的疗效,积累了不少经验.然而,细胞因子治疗急性辐射损伤的用药对象、剂量、时机及合理的配伍应用等问题尚未解决,疗效
截至2006年11月末,国家开发银行金融债券发行突破3万亿元。文章回顾了开发银行的成功实践;指出在开发性金融理念的正确指引下,开发银行不但筹集到巨额资金有力地支持了国家重点
回顾了500米口径球面射电望远镜(Five-Hundred-meter Aperture Spherical radio Telescope;FAST)的建设历程并阐述了其主要科学目标,重点论述了FAST工程的科学精神及社会影响,
目的:比较经颅多普勒和脑电图检查在短暂性脑缺血发作中的应用价值。方法:选择本院收治的72例短暂性脑缺血发作患者作为研究对象,72例患者均应用脑电图检查与经颅多普勒检查,比较
又一次来到许昌胖东来劳动路店,从卖场前端深入到其后台操作间,总是能为我们呈现出不一样的胖东来,不管是商品陈列、色彩搭配,还是员工的现场管理,不管是后台的标准化,还是对
义疏,即“以一部经注为主,在此基础上,对经注文所涉及的内容再详加解说、补充、修正、阐释、发挥。”[1]若以此观点为参照,皇侃《论语义疏》的体例特色有二:一是就皇侃的整个
<正>一、从Diaspora谈起对犹太流散文学的回顺须从一个术语Diaspora谈起。该词用为普通名词(即diaspora)时指"同一起源之人民的流散",用为专用名词时特指"犹太人的流散"或"流
无线传感器网络(Wireless Sensor Networks,WSN)被认为是近年来研究的热点之一,在过去几年已经有很多国内外学者对此展开研究工作,无线传感器网络得以迅速发展。无线传感器网
本文将长江中游的新石器文化置于全国新石器时代的总体背景下,侧重于比较研究的视角,选取了五个方面的问题-聚落与建筑,栽培稻起源和史前稻作农业,白陶和彩陶,普用的巫物陶偶