论文部分内容阅读
第一部分肝癌术后极早期复发的定义背景:国内外对早期复发的时限尚没有统一的认识,多数学者将术后2年内的肝癌复发定为早期复发,但也有学者将术后1年内,8个月内,甚至6个月内的复发定义为早期复发。因此目前对早期复发的时间界定尚有争议,有待更多研究证据。本研究目的是尝试定义肝癌术后极早期复发,比较极早期复发及早期复发的临床特征,并筛选独立危险因素。方法:利用术后复发不同截止月份,将这些病人分为极早期复发或早期复发队列,用最小P值法比较复发后生存时间(post-recurrence survival,PRS)。比较极早期或早期复发病人的临床病理特征及预后。采用逐步后退选择的方法进行多因素Cox回归筛选独立危险因素。结果:利用最小P值法确定8个月为最佳cut-off值(p=6.70E-14,Hazard ratio=0.565),因此把肝癌术后8个月内复发定义为极早期复发,肝癌术后8-24个月复发定义为早期复发。具有侵袭性肿瘤特征(肿瘤较大、多发肿瘤、合并MVI和卫星子灶、肿瘤分化差)和BCLC及AJCC肿瘤分期更晚的病人更容易出现极早期复发,并且预后更差(p<0.0001)。多因素分析结果表明甲胎蛋白、术中出血量、肿瘤直径≥5cm,多结节肿瘤,合并有微血管癌栓、肉眼癌栓、卫星结节是极早期复发的独立危险因素。结论:术后8个月内复发定义为极早期复发。极早期复发只有短短的8个月时间,复发人数却占总复发人数一半左右。极早期复发的病人肿瘤恶性程度更高,预后明显更差,是肝癌病人术后早期死亡的最主要原因,严重影响着病人的预后。第二部分基于机器学习的肝癌术后极早期复发预测模型背景:我们发现肝癌根治性切除术后8个月内复发的病人肿瘤恶性程度高,复发率高,预后明显更差,是病人术后早期死亡的最主要原因,严重影响病人的预后。因此术后需要对极早期复发密切监测及预测。传统上,Logistic和Cox模型应用于预后预测模型,但预测性能有限。机器学习是用先进算法处理这些变量。机器学习模型比传统模型有2个优势:一是使用非线性函数,二是考虑所有变量之间可能的作用。目前,机器学习模型已广泛应用于肝癌研究,并取得良好的结果。本课题的研究目的及意义是研究应用机器学习建立肝癌术后极早期复发预测模型。方法:来自两个医院共有3583例接受根治性切除的肝细胞癌病人纳入研究。采用性别、年龄、血小板、病因、白蛋白、总胆红素、ALBI分级、甲胎蛋白、手术类型、手术切缘、术中出血量、术中输血量、肿瘤大小、肿瘤数量、微血管侵犯、肉眼癌栓、肿瘤分化等级、肿瘤包膜、卫星子灶、肝硬化类型构建XGboost、随机树林、支持向量机、朴素贝叶斯、分类与回归树、Logistic回归模型。结果:在训练、内部和外部验证组,随机树林的AUC分别为0.782,0.832和0.818;XGboost的AUC分别为0.909,0.822和0.817;支持向量机的AUC分别为0.868,0.822和0.815;分类与回归树的AUC分别为0.770,0.799和0.803;朴素贝叶斯的AUC分别为0.774,0.818和0.806;Logistic回归的AUC分别为0.802,0.831和0.803。结论:成功构建多种机器学习算法预测肝细胞癌术后极早期复发,其中随机森林、SVM和XGboost在预测极早期复发有很好的效果。第三部分基于随机生存森林的肝癌术后早期复发预测模型背景:目前,主流机器学习算法难以处理具有删失特征的生存数据。随机生存森林(Random survival forests,RSF)算法是一种基于决策树集成学习的回归算法,具有随机森林的特征。其训练过程更快,估计偏差更小。本课题的研究目的及意义是应用随机生存森林算法建立高准确率的肝癌术后早期复发预测模型。方法:来自两个医院共有4758例接受根治性切除的肝细胞癌病人纳入研究。采用性别、年龄、血小板、病因、白蛋白、总胆红素、ALBI分级、甲胎蛋白、肿瘤大小、肿瘤数量、微血管侵犯、肉眼癌栓、肿瘤分化等级、肿瘤包膜、卫星子灶、肝硬化类型构建随机生存森林(RSF)模型。应用区分度、校准度、临床有用性和整体性能进行评估,并与其他模型进行比较。结果:构建200棵生存树预后,预测错误率很低且稳定。最重要的5个变量是肿瘤大小、大血管侵犯、微血管侵犯、肿瘤数量和AFP。在训练、内部验证和外部验证队列中,RSF模型的C-index分别为0.725(标准误差[SE]=0.005)、0.762(SE=0.011)和0.747(SE=0.016);K-index的RSF模型分别为0.684(SE=0.005)、0.711(SE=0.008)和0.697(SE=0.014);RSF模型的时间依赖AUC(2年)分别为0.818(SE=0.008)、0.823(SE=0.014)和0.785(SE=0.025)。RSF模型优于ERASL模型、韩国模型、AJCC TNM分期、BCLC分期和中国分期。在训练和两个验证队列RSF模型能够将病人分为三个不同的风险组(低风险,中风险,高风险组)(p<0.0001)。结论:RSF模型是预测肝癌病人根治性切除术后早期复发的可靠工具,因为它表现出优于其他模型的性能。该模型将有助于指导术后随访和辅助治疗。第四部分基于炎症指标的肝癌预后nomogram预测模型背景:肝癌病人肝切除术后的预后较差,本研究旨在构建结合炎症指标和肿瘤特征的nomogram预测模型评估肝癌根治性切除术后病人的总体生存期(OS)和无复发生存期(RFS)。方法:总共纳入3071例接受根治性切除的肝癌病人。通过Cox回归分析确定独立危险因素,并用于构建nomogram预测模型。用C指数、时间依赖的受试者工作特征曲线下面积(time-dependent AUC)、决策曲线(DCA)和校准曲线来评估列线图的性能。结果:多因素分析显示:AFP、切缘、NrLR、PLR、GPR、肿瘤大小、肿瘤数量、微血管侵犯、Edmonson-steiner分级是OS相关的独立危险因素。与RFS相关的独立危险因素是肝炎、AFP、ALBI分级、NrLR、PLR、PNI、GPR、肿瘤大小、肿瘤数目、微血管侵犯和Edmonson-steiner分级。训练和验证队列线图的C指数对OS为0.71(95%置信区间[CI]:0.70-0.73)和0.71(95%CI:0.69-0.74),对RFS为0.71(95%CI:0.70-0.73)和0.74(95%CI:0.72-0.76)。列线图的C指数、时间依赖AUC和DCA显示出明显优于常用分期系统的预测性能。该模型可以将病人分为三个不同的危险组。基于网络的工具方便临床实践。结论:两种新的列线图整合了炎症相关指标和临床病理参数,用于预测接受根治性切除的肝癌病人的OS和RFS。这些模型将有助于指导术后个体化随访和辅助治疗。第五部分肝癌术后辅助TACE评分模型背景:目前预防肝细胞癌根治性切除术后复发的辅助治疗仍没有明确的统一标准。术后辅助经动脉化疗栓塞(PA-TACE)作为一种预防肝癌术后复发的辅助治疗正成为人们关注的焦点。最近的研究表明,PA-TACE对肝癌术后复发风险高的病人有益,但很难确定哪些病人可能受益于PA-TACE。我们的目的是开发一个易于使用的评分系统来识别这些病人。方法:共纳入4423例接受根治性切除术的肝癌病人。在训练队列中采用Cox回归模型筛选独立危险因素,建立PDTE评分系统。结果:PDTE评分系统由AFP、ALBI分级、手术出血量、切缘、肿瘤包膜、卫星结节、肿瘤大小、肿瘤数目、微血管侵犯及大血管侵犯等10个危险因素组成。以5分作为分界值,在>5分组中,PA-TACE可改善无复发生存率(RFS)(p<0.001),然而,在≤5分组中,PA-TACE对RFS有负影响(p=0.006)。结论:该模型是一种可靠的工具,可推荐肝细胞癌病人根治性切除术后使用PATACE治疗。>5分的病人可能受益于PA-TACE,PA-TACE对于≤5分的病人没有获益甚至可能有害。