【摘 要】
:
目的:结合机器学习算法和SEER数据库(隶属于美国国立癌症研究所的数据库),评估胰腺癌患者远处转移的预测因素,并构建出预测模型,以帮助临床上对于胰腺癌患者的诊疗决策。方法:通过我们的筛查标准,从SEER数据库中提取出2010年到2015年的13606个胰腺癌病例。分别使用了传统logistic回归统计方法和基于梯度提升的机器学习算法建立了两个预测胰腺癌远处转移的模型。采用了曲线下面积(AUC)、校
论文部分内容阅读
目的:结合机器学习算法和SEER数据库(隶属于美国国立癌症研究所的数据库),评估胰腺癌患者远处转移的预测因素,并构建出预测模型,以帮助临床上对于胰腺癌患者的诊疗决策。方法:通过我们的筛查标准,从SEER数据库中提取出2010年到2015年的13606个胰腺癌病例。分别使用了传统logistic回归统计方法和基于梯度提升的机器学习算法建立了两个预测胰腺癌远处转移的模型。采用了曲线下面积(AUC)、校正曲线、决策曲线(DCA)对比验证了两种模型的鉴定能力及临床实用性。同时对有关因素进行了逐步COX回归分析并应用Kaplan-Meier法做出了相关因素的生存曲线。结果:在13606例胰腺癌患者中,中位年龄65岁,平均年龄64.98岁,远处转移患者占总人口的25.02%。胰腺癌的远处转移的患者明显预后较差。XGBoost模型的AUC为0.77,优于logistic回归模型的0.75,且XGBosst模型预测结果与预测胰腺癌患者远处转移的校正曲线吻合较好,决策曲线(DCA)的结果也显示出较好的临床净效益。XGBoost预测模型相比传统预测模型,在评估胰腺癌远处转移方面中有更好的实用性、可靠性和临床净效益。结论:机器学习的算法提供了较传统方法更好的预测技术。利用机器学习的算法建立胰腺癌远处转移的预测模型,可以方便地应用于临床,帮助改善胰腺癌的临床诊疗。
其他文献
本文在分析以往研究成果的基础上,提出了用单权函数数值积分逼近算法(即采用一个权函数,结合数值积分法),可以同时计算出样本的变差系数和偏态系数。给出了两种单权函数的详细求解
提防工程存在着堤顶高程偏底,堤身断面单薄,土质差,堤身堤基渗漏严重等问题,加以防汛备料不足,致使洪水期间不少堤段产生管涌等渗透破坏。
为弥补燃气机组中整体模型研究的不足,提出一种将热力学模型和灰箱模型相结合的建模方法。首先,根据分块建模思想,在APROS平台上建立了热力学模型,将仿真结果与性能验收结果进行
本文介绍了功率因数的概念,并推导了功率因数的相关计算公式。通过对计算公式的分析,得出了功率因数与用电量之间的关系,明确了提高功率因数对于用电企业降低其自身电费支出
壳聚糖是一种高分子聚阳离子化合物,也是目前为止发现的唯一碱性的天然多糖,每年的生产总量仅低于纤维素,位居第二。壳聚糖因其特殊的生物学特性和理化性质而具有降血糖、调
为了分析不同沉积状态的淤泥流变特性,本文将淤泥作为线性粘弹性体,提出了根据泥水系统控制方程解答和波浪在泥床上传播时的实测变化规律求取淤泥流变参数的反分析方法,并利
详细介绍了中海海南发电有限公司洋浦电厂220 MW燃气-蒸汽联合循环机组的启动过程,对联合循环机组启动过程中遇到的疑难问题进行了分析和探讨,从运行角度提出了可行的解决方
【摘要】聚类分析是一种按照中心点或分层的方式对样本数据进行归并的数学方法.本文在分析高职高专院校各专业招生计划人数、录取人数以及录取分数的基础上,结合K-Means聚类,从定量的角度对高职高专院校各专业如何科学制订招生计划进行综合分析,进而改进招生策略,制订更科学、合理的招生计划,提升高职高专院校生源质量和录取率. 【关键词】K-Means聚类分析;招生计划数;录取分数 【中图分类号】F222
债券市场是资本市场和金融市场的重要组成部分,也是实体经济融资的重要渠道之一。从市场规模的不断扩大,创新产品的推陈出新,到参与主体的丰富多元,债券市场经历了跨越式的发