基于机器学习的IgA肾病患者预后预测模型建立及免疫抑制剂治疗模式评估

来源 :南京医科大学 | 被引量 : 0次 | 上传用户:t123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
IgA肾病(Immunoglobulin A nephropathy,IgAN)是世界范围内特别是亚洲地区最常见的原发性肾小球肾炎以及终末期肾病(end-stage kidney disease,ESKD)的重要原因。IgAN患者的临床表现多变,病理改变亦多样化,具有高度异质性的疾病表型。IgAN患者长期预后不佳,大约30-40%的患者在10-25年之间会进入ESKD。根据IgAN患者的临床和病理表现对疾病进展风险进行分层及准确预测肾脏的长期预后对指导患者的个体化治疗和管理具有重要的临床意义,而且对相关的临床试验也具有关键的指导作用。虽然IgAN被认为是一种免疫介导的疾病,但哪些IgAN患者可以获益于免疫抑制剂治疗以及如何识别这部分患者仍然具有争议。机器学习在医疗领域可用于建立精准的预测模型及识别具有异质性治疗反应的患者亚群。本课题旨在利用机器学习对来自全国多中心的IgAN患者的基线和长期随访数据进行分析,建立一个结合临床和病理变量的预后预测和风险分层模型,辅助医生快速、准确地预测患者的肾脏预后。同时,本课题还结合全面的临床及病理变量,利用机器学习识别及外部验证了IgAN患者中使用免疫抑制剂的获益人群,为IgAN患者的个体化治疗提供依据。第一部分 基于机器学习的IgA肾病患者预后预测模型建立目的:建立基于机器学习的预测IgAN患者长期肾脏预后并进行风险分层的预测模型,协助制定临床决策和设计未来的临床试验。方法:回顾性分析来自中国18个肾病中心2047例经肾活检确诊的IgAN患者资料。将来自单中心的1022名患者作为训练队列,来自18个中心的1025例患者作为验证队列。共收集患者36个流行病学、临床及病理学特征。研究结局定义为联合结局,即自患者诊断性肾活检时间起5年内ESKD及估算的肾小球滤过率(estimated glomerular filtration rate,e GFR)下降50%的发生。使用一种梯度提升模型,即极端梯度提升(e Xtreme Gradient Boosting,XGBoost)算法,在36个待选变量中选择10个最重要的变量。使用Stepwise Cox回归模型基于以上10个变量建立一个简化的评分量表模型(scoring scale model,SSM)。使用C统计量和Hosmer-Lemeshow检验评估模型的区分度和校准度。使用Kaplan-Meier法评估SSM的风险分层能力。使用Shapley加性解释(SHapley Additive ex Planations,SHAP)方法解释XGBoost模型所得到的预测结果。结果:1.在训练队列和验证队列中,各有74和114名患者达到了联合结局。2.建立多种机器学习及统计模型,XGBoost模型在训练队列和验证队列中预测结局的C统计量分别为0.89(95%置信区间[confidence interval,CI],0.87-0.94)和0.84(95%CI,0.80-0.88),在多种机器学习及统计模型中,其在验证队列中达到了最高的C统计量,故被选为最终应用的精准预测模型。3.XGBoost模型可提供变量的重要性得分,排名前10的变量分别为肾小管萎缩/间质纤维化(重要性得分=0.156),血清白蛋白(0.125),球性硬化(0.109),高血压(0.078),血清尿酸(0.063),尿沉渣红细胞计数(0.063),活检时年龄(0.063),尿蛋白定量(0.063),平均系膜积分(0.047)以及血清肌酐(0.047)。4.为进一步提高模型的实用性,建立SSM,SSM最终包含了3个变量,分别为尿蛋白定量、球性硬化比例及肾小管萎缩/间质纤维化(tubular atrophy/interstitial fibrosis,T)比例。变量经离散化得到截断值,根据回归模型的系数得到各变量的得分:T1、球性硬化比例>25%、尿蛋白定量>1 g/24h各1分,T2为2分。使用Kaplan-Meier法进行分析,SSM可显著识别具有不同肾脏预后的患者(P<0.001)。5.将XGBoost模型和SSM整合为南京IgAN风险分层系统,并在网页上发布。6.使用SHAP方法阐明了重要变量对预测患者结局的影响。结论:本研究建立了一个使用常规可获得的变量并且基于机器学习算法以及生存分析的南京IgAN风险分层系统,其中包含一个精准预测模型XGBoost,以及一个风险分层的SSM,并提供了一个网页计算器,使得模型得以在临床实践中简单快速地应用。通过南京IgAN风险分层系统,可以准确预测IgAN患者远期肾脏预后,为临床试验的特定患者群筛选提供依据,并辅助预后分层管理及分级诊疗,从而提高IgAN患者个体化治疗和管理水平。第二部分 基于机器学习的IgA肾病患者免疫抑制剂治疗获益人群识别与验证目的:使用机器学习方法识别并验证IgAN患者免疫抑制剂治疗的获益人群。方法:回顾性收集来自中国24个中心4047例经肾活检确诊的IgAN患者的临床及病理资料。将来自18个中心的2058名患者组成训练队列,来自7个中心的1989名患者组成验证队列。使用一种机器学习算法即基于模型的递归分区应用于训练队列,将患者自动分为具有不同免疫抑制剂长期获益的亚群,免疫抑制剂的长期获益与患者达到ESKD的时间有关,并且由Cox回归中校正后的风险比(hazard ratio,HR)与校正后的Kaplan-Meier分析进行衡量。结果:1.在训练队列中,接受免疫抑制剂治疗的患者较未治疗者,尿蛋白更高,且有更多肾组织活动性病变,随访过程中使用抗高血压药物及他汀药物者更多,e GFR下降更慢,但ESKD发生率与长期肾脏生存无明显差异。2.基于分区决策树,对内部节点及叶节点的患者免疫抑制剂治疗获益进行评估,并校正混杂因子,共发现3个亚群的患者得到显著的免疫抑制剂长期获益,具有HR<1。在血清肌酐≤1.437 mg/d L的患者中,尿蛋白定量>1.525g/24h的患者可以显著获益(节点6;HR=0.50;95%CI,0.29-0.89;P=0.02),特别是那些尿蛋白定量>2.480 g/24h的患者(节点8,HR=0.23;95%CI,0.11-0.50;P<0.001)。而在血清肌酐>1.437 mg/d L的患者中,尿蛋白较高且具有肾组织新月体病变的患者接受免疫抑制剂治疗可以显著获益(节点12;HR=0.29;95%CI,0.09-0.94;P=0.04)。3.使用bootstrap分析证实了以上获益亚群中同样的免疫抑制剂治疗长期获益。4.使用4种不同缺失值填补方式对数据进行预处理,进行敏感性分析,结果与原模型一致。5.在3个获益亚群中,免疫抑制剂还可以降低3个研究次要终点(e GFR下降30%、40%和50%)的风险,为本研究结论提供了间接证据。6.在验证队列中,各个亚群的治疗长期获益得到了外部验证。结论:综合分析IgAN患者肾功能、尿蛋白水平及肾组织病变特点有望为IgAN患者免疫抑制剂治疗的选择提供指导。免疫抑制剂获益亚群的发现为辅助治疗决策、制定有针对性的临床试验患者入组条件,以及个体化治疗IgAN患者提供依据,从而促进肾脏疾病精确医学的发展。
其他文献
多元统计分析(Multivariate statistical analysis,MSA)是农学、医学、工程学、气象学、地质学、心理学等众多科学的问题的基本研究办法之一,在生产以及实际生活中有重要的应
目的:肥胖可引起胰岛素抵抗、肝脏异位脂质沉积等代谢紊乱。巨噬细胞介导的慢性低烈度炎症反应在肥胖相关性代谢紊乱中起关键作用,但具体的调控机制仍不完全清楚。穹窿主体蛋
近年来具有脉冲效应的确定性传染病模型得到了广泛的研究并取得了深入的成果.脉冲传染病模型的研究为人们理解疾病在脉冲影响下的动力学行为、制定和检验传染病的防控策略提
医学是一门人学,是关系人类幸福的事业,对人的全面关怀为医学应有之意。医学人文素养是医学的灵魂,反映了人类对生命的根本态度,医师人文素养的高低直接影响民众的幸福感、获
新中国成立70年来,中国共产党带领占世界五分之一人口的中国人民,实现了从“站起来”“富起来”到“强起来”的飞跃,创造了人类历史上前所未有的发展奇迹。站在新时代新的历
随着人类对建筑美观和功能的需求,高层建筑的表面普遍采用了包括遮阴条、阳台、竖框及其它装饰条在内的各种粗糙条。很明显,这些粗糙条会极大地影响建筑表面的风压分布,从而
随着人类社会发展,重金属离子污染成为严重威胁人类健康的重要因素,通过食品进入人体是人体内重金属的主要来源之一,因此对食品中重金属离子的检测尤为重要。然而当前的重金
自动推理是人工智能重要的组成部分,主要包括命题逻辑求解和一阶逻辑定理证明。一阶逻辑系统相比命题逻辑系统具有更丰富的表达能力,许多的现实问题都可用一阶逻辑表示。因此
家蚕(Bombyx mori)是昆虫纲鳞翅目昆虫,有超过5000年的人工驯养的历史,自古以来就是中国重要的经济动物,也是中国传统文化的重要载体,同时,家蚕还是重要的鳞翅目模式生物,具
恰当的商业信用策略可以帮助企业获得更多的收益,既是企业竞争优势的重要来源,也是供应链中企业间竞争的重要手段之一。但是企业在提供商业信用获得竞争优势的同时,也需要承