基于集成学习模型的糖尿病患病风险预测研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:jiabhh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高早期糖尿病患病风险的预测准确性,基于集成学习算法建立糖尿病患病风险预测模型.分别基于集成学习算法随机森林、GBDT和XGBoost建立糖尿病预测模型,并比较以上3种方法与单一分类器支持向量机和BP神经网络的分类预测性能.在UCI数据库的早期糖尿病数据集上进行验证试验,使用准确率、精确率、召回率、F1分数和AUC 5个指标评价模型效果,并基于最佳性能模型对变量重要性进行排序.所有模型中,基于集成学习的XGBoost算法准确率、精确率、召回率、F1值、AUC值最高,分别达到97.44%、99.02%、97.12%、98.06%、99.41%,比支持向量机的预测准确率提高了3.85%,比BP神经网络的预测准确率提高了2.57%.XGBoost算法给出的变量重要性排序中,影响权重排名前十的因素依次为烦渴、多尿症、脱发、无力、体重减轻等.基于随机森林、GBDT和XGBoost 3种集成学习算法的糖尿病患病风险预测模型表现出较好的性能,能比单分类器更准确地识别出早期高风险患者,有助于临床医生进行更精准的医疗决策.
其他文献
医护人员在处理医疗不良事件时,大多依靠个人主观经验给出解决方案.采用知识图谱特征学习和协同过滤算法相结合的方式对医院长期积累的不良事件数据集进行采集训练,为医护人员提供最优解决方案.首先通过知识图谱训练算法将不良事件中的病人信息转化为低纬向量,采用余弦相似度算法计算出病人的相似矩阵;再通过协同过滤算法依靠事件基本信息计算出不良事件的相似矩阵;最后将两者结合为一个推荐结果集.该算法提供的推荐结果集正确率比传统方法平均提高35%,不仅减轻了医护人员的负担,还有助于管理层更有效地追溯责任人.
及早判定地震是否为强震,可为快速开展救援行动、减少生命和经济损失争取时间.提出三元组卷积神经网络(Triplet-CNN)模型,对地震强弱进行预判研究.以日本宫城地区为例,通过该地区地震目录获取2000-01-01至2008-12-31间历史地震事件记录,包括震级以及对应的KiK-net和K-net强震仪时间序列数据,利用设计的Triplet-CNN结构对这些强震仪数据进行训练,实现对强弱地震的快速判定.通过超参数优化,该模型的准确率达到96.85%,精确率96.83%,召回率96.82%,F1值96.8
2022 年第3期《猪业科学》杂志以“母猪批次化管理实践大盘点”为主题,邀请行业内专家、企业技术人员对母猪批次化管理实践进行深入盘点与总结,为养殖者进行科学、高效生产提供依据.读完之后,给我的总体感受是策划得当、主题鲜明、内容全面、数据详实.
期刊
针对传统指数平滑时间序列模型预测精度不足及传统BP神经网络在训练过程中易陷入局部最优的问题,通过粒子群算法优化BP神经网络,对美国明尼苏达州2021年7月11日至8月25日新冠肺炎累计死亡和累计确诊人数进行时间序列预测,并与传统双指数平滑模型(Holt)、BP神经网络模型进行比较分析.实验结果显示,PSO-BP模型的预测精度均高于基准模型,平均误差百分比(MAPE)低于0.08%.在6组预测实验中,PSO-BP模型相较于Holt与BP模型,平均误差分别降低了0.038%和0.012%,平均绝对误差(MAE
南油丝苗是广东省农业科学院水稻研究所应用籼稻动态株型育种理论技术而新育成的优质籼稻品种,2019年通过广东省农作物品种审定.具有丰产性好,米质达部标1级,抗稻瘟病,中抗白叶枯病等特点,适宜广东省粤北以外稻作区早、晚季种植.总结了南油丝苗新品种的选育过程和栽培技术要点.
由于在人体脊柱图像分割中,分水岭算法存在过分割现象以及对微弱边缘、噪声非常敏感的问题,故对其进行改进.原始人体脊柱CT图像存在许多不必要的局部极小值,首先利用K-means++聚类算法进行区域分类,减少错误的局部极小值;然后利用形态学图像处理技术对初始分割图像进行去噪处理,使图像变得平滑;接下来提取区域最大值标记为图像前景,将阈值分割得到的图像标记为背景;最后通过分水岭变换得到人体脊柱分割结果图.实验结果表明,该算法能实现对人体脊柱图像的准确分割,其Dice系数、Jaccard系数与Precision系数
特征提取是医学图像处理过程的重要步骤,为疾病诊断提供了强有力的基础.设计一个医学图像处理平台,可实现影像数据的基本操作,提取癌症病灶区的特征,为后续诊疗工作提供数据支持.平台采用MVT开发模式,前端设计主要采用HTML5技术,算法层面设计引入Python相关的医学图像处理算法包.采用B/S架构实现前端显示与后端数据的联动,构成完整的医学图像处理系统.为验证平台提取特征的可用性,以乳腺癌为例,结合机器学习模型进行实验验证.结果表明,该平台可正常运行于计算机端,并且可进行医学图像的基本操作以及图像特征的提取,
为制定黄河干流河南段黄河鲤的开捕规格和总允许捕捞量,根据2013—2016年黄河干流河南段黄河鲤的现场调查数据资料,分析黄河鲤资源群体的体质量与体长组成,拟合黄河鲤的体长-体质量关系式,计算体长生长方程和体质量生长方程的参数,求解黄河鲤个体的体质量生长拐点年龄、资源群体的临界年龄和总死亡率系数,评估黄河干流河南段黄河鲤的资源量.结果表明:黄河鲤的体长生长方程为Lt=625×(1-e-0.31(t+0.387)),体质量生长方程为Wt=5343.3×(1-e-0.31(t+0.387))3.014,体质量生
多智能体系统能够在部分能力不足时更有效地到达目标,具有许多组件的多智能体系统如何到达期望目标是一个重要议题.受生物的嗅觉和视觉导航模式启发,使用群决策方法建立多智能体导航模型,以更好地发挥多智能体系统鲁棒性优势.由于多个智能体对信息和动作的集体决策,驱使模型生物朝着特定目标前进.使用栅格地图开发受生物嗅觉启发的导航算法,并通过迷宫实验考察使实体尽可能接近目标的最佳参数.实验结果表明,在复杂障碍环境下,在嗅觉和视觉模式之间取得平衡是一个关键点.超出该临界点,模拟生物在复杂环境中的导航能力将大大增加,在智能体
为辅助临床诊断胆囊癌,使用深度学习技术,通过改进的3D-DenseNet建立一个基于患者增强CT影像的胆囊癌辅助诊断模型.首先,将患者多张动脉期CT转化为三维影像,利用医生标注的胆囊区域,将三维影像切割出感兴趣区域;然后对传统DenseNet网络进行优化,改进Dropout机制与Softmax损失函数并在输出部分将交叉熵函数替换为Focal-loss以进行不平衡校正,从而建立胆囊癌辅助诊断模型;最后,将测试集结果与金标准进行比较,采用ROC曲线、召回率、准确率评估模型性能.通过训练集不断迭代训练,模型损失