论文部分内容阅读
背景和目的肝细胞癌微血管侵犯(MVI)是根治性手术治疗后早期复发的重要原因,但其诊断只能通过手术切除样本进行显微镜下诊断。目前有研究提出炎性指标,如中性粒细胞比淋巴细胞比值(NLR)、淋巴细胞与单核细胞比值(LMR)、血小板比淋巴细胞比值(PLR)与MVI有关,然而结果相互矛盾。肿瘤大小与MVI的关系密切,但其评判界值存在争议。术前准确预测MVI具有重要临床意义。目前的MVI预测模型多数来自影像组学,研究方法异质性大,难以推广。现有的肝细胞癌预后分期系统因引入异质性和缺少关键预后影响因素,难以准确预测个体生存期。为此,本研究将真实世界的肝癌患者临床数据作为基础,通过缜密的统计分析,以期(1)明确炎性指标与MVI的关系;(2)量化肿瘤大小与MVI的关系;(3)构建性能稳健、临床适用的MVI预测模型;(4)以常用临床指标构建包含影响预后多方面因素的肝细胞癌患者生存期预测模型。方法1、收集临床资料:以2015年10月至2020年10月在南昌大学第一附属医院经病理诊断的肝细胞癌为研究对象,收集人口学及病史、实验室检查、影像学检查和病理诊断资料,并随访患者的生存状况。2、分析炎性指标NLR、LMR、PLR及肿瘤大小与MVI的关系:首先单因素分析、曲线拟合可视化各指标与MVI的关系;然后筛查协变量、调整混杂因素、曲线拟合可视化各指标与MVI调整混杂后的关系;再通过趋势性检验、敏感性分析检验各指标与MVI的关系;最后亚组分析和交互作用检验,查看肝细胞癌亚组中,炎性指标和肿瘤的大小与MVI的关系。3、采用多种变量筛选方法构建MVI预测模型:结合病史、影像学和实验室、病理指标,用多种变量筛选方法(最优子集法BSR、贝叶斯准则BIC、逐步回归、Mallos CP、LASSO回归)找出MVI的独立预测因素,并分别进行Logistic回归建模,通过受试者工作特征曲线下面积(AUC)、校正曲线、决策曲线(DCA)、临床影响曲线评价各模型的预测价值。4、机器学习XGBoost构建MVI预测模型:比较上述不同变量筛选方法所建模型,计算模型的净重分类指数(NRI)和综合改进指数(IDI),筛选出重要且稳定的具有独立预测价值的特征因素,然后通过机器学习XGBoost法构建MVI预测模型,并与Logistic回归模型比较预测性能。5、制作网页在线使用MVI预测模型:将XGBoost法构建MVI预测模型制作成基于互联网浏览器的网页,输入模型的变量值即可预测个体MVI风险,并创建二维码,便于应用。6、基于临床指标构建肝细胞癌术后生存预测模型:采用最优子集回归及Adjusted-R~2进行特征变量筛选,使用多因素COX回归构建肝癌术后患者生存预测模型,并绘制2、3、4、5年生存率预测列线图,采用Bootstrap重抽样500次内部验证,并绘制时间依赖的ROC曲线、校准曲线和决策曲线以评估模型的预测性能。结果1、炎性指标NLR、LMR、PLR及肿瘤大小与MVI的关系:单因素分析及曲线拟合显示NLR、LMR、PLR及肿瘤大小均与MVI相关,并且NLR与MVI呈曲线相关,但调整混杂因素后发现:(1)NLR与MVI非独立相关(OR:0.99,95%CI:0.84~1.16,P=0.886);(2)LMR与MVI风险非独立相关(OR:1.01(0.89~1.14)0.933);(3)PLR与MVI非独立相关(OR:1.06,95%CI:0.85~1.32,P=0.593;(4)肿瘤大小与MVI独立相关(OR:1.34,95%CI:1.22~1.46,P<0.001)。肿瘤增大1cm,MVI发生率增加34%。2、根据不同方法筛选变量分别构建的MVI预测模型:基于不同变量选择方法构建的4个MVI预测模型(Model 1~4)包含的变量数分别为2、8、9、11个,其AUC及95%CI分别为:74.4%(70.2%~78.6%)、76.4%(72.4%~80.5%)、76.7%(72.7%~80.7%)、76.9%(72.9%~80.9%)。只有Model 4和Model 1的AUC有统计学差异(AUC差异0.025,95%CI:0.002,0.048,P=0.034)。NRI提示Model4较1改善49.8%(95%CI:0.331~0.666,P<0.01),IDI为0.045(95%CI:0.026-0.063,P<0.01)。考虑到Model4包含11个变量,而IDI改善并不多,因此选择Model1包含的2个变量(甲胎蛋白AFP和肿瘤大小Size)为最稳定的独立预测变量。3、机器学习XGBoost构建MVI预测模型结果及比较:基于上述变量筛选和验证结果,应用极限梯度提升的XGBoost构建由AFP和Size两个变量的MVI预测模型,并绘制列线图。模型Bootstrap重抽样500次的预测MVI的AUC及95%CI为:0.831(0.796~0.867)。以0.468为最佳阈值,模型的敏感度为0.843,特异度为0.695。XGBoost构建的Model的AUC比Logistic构建的Model 1明显更优(P<0.001),校准曲线显示预测结果与实际结果一致好,决策曲线显示模型在临床应用有较大净获益。4、基于XGBoost的MVI预测模型的在线智能使用:将XGBoost模型制作成互联网浏览器的网页计算器,扫码输入肝细胞癌患者的AFP和肿瘤大小(cm)指标数值,可以得出MVI风险值。5、构建肝细胞癌术后患者生存率预测模型:根据调整后R~2和临床经验,构建包含以下变量的HCC生存率预测模型:肿瘤大小、肿瘤个数和卫星结节、门静脉侵犯、Child-Pugh分级、肝硬化、年龄、CA125、AFP和术后预防性TACE。将模型以列线图呈现,采用Bootstrap重抽样500次绘制2、3、4、5年的ROC曲线,AUC及其95%CI分别为76.6(71.3,81.8),73.1(67.8,78.4),68.8(62.9,74.8),67.4(60.4,74.5),校准曲线显示模型的一致性良好,决策曲线显示其在临床应用获益明显。风险评分图显示随着风险评分增加,死亡事件增加。结论本研究得出以下结论:1、通过严谨而细致地分析炎性指标与肝细胞癌MVI的关系,发现NLR、LMR和PLR不是MVI的独立相关因素。2、肿瘤大小与肝细胞癌MVI独立相关,随着肿瘤增大,MVI风险明显增加。3、通过多种变量筛选方法并构建MVI预测模型,最终确定AFP和肿瘤大小是稳定而独立的MVI预测因素,通过XGBoost构建的MVI预测模型优于Logistic回归模型,使用网页版计算器和二维码可方便有效地应用于肝细胞癌的MVI预测。4、根据常用临床指标构建的肝细胞癌生存率预测模型,能较好地预测患者2、3、4、5年总生存期,便于患者的预后分层评估。