论文部分内容阅读
目的头颈部鳞癌(Head and Neck Squamous Cell Carcinoma,HNSC)患者在诊断时往往已处于局部晚期或转移性阶段,传统放化疗对患者预后没有明显改善。免疫治疗因其高效、安全的特点在HNSC患者综合治疗中的作用日益突出。肿瘤微环境的复杂性和异质性导致相同病理分期的HNSC患者免疫治疗效果存在差异。本研究旨在评估HNSC的肿瘤免疫微环境,识别与免疫相关的差异mRNA,体细胞突变基因和DNA甲基化位点的多组学特征。构建并比较多组学预后预测模型,为高维数据的生存分析提供方法学参考,并为全面寻找HNSC免疫相关预后生物标志物提供可靠线索。方法从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库下载HNSC患者的mRNA表达、体细胞基因突变和DNA甲基化数据,根据标准纳入493例HNSC患者。利用ESTIMATE算法计算免疫评分和基质评分,按照最佳截断值分为高免疫组(n=121)和低免疫组(n=372)。t检验或方差分析进行不同临床特征的免疫/基质评分的差异性比较,Log-rank检验进行高和低免疫/基质组生存率的差异性比较。对高和低免疫组的mRNA表达、体细胞突变频率和DNA甲基化位点的bate值进行差异分析。将有差异的多组学变量纳入单因素Cox回归。将患者按2:1分为训练集和验证集,对单因素有意义的变量在训练集中建立最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)-Cox、CoxBoost模型和随机生存森林(Random Survival Forest,RSF)-Cox三种预测模型。采用受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic curve,AUC)、一致性指数(Concordance index,C-index)和Integrated Brier score(IBS)三种指标对训练集和验证集的模型效果进行评价。基于最优模型计算风险评分,根据最佳截断值将训练集、验证集和总人群分为高、低风险组,并进行生存分析。将多组学模型应用到不同人口学和临床特征人群中进行亚组分析。采用多因素Cox回归分析多组学模型、人口学和临床特征的独立预后能力。使用的统计分析软件为SPSS 23.0和R 4.0.3,为双侧检验,检验水准=0.05。结果1.肿瘤远处转移、淋巴结转移级别越高、肿瘤大小越大、肿瘤分期越高,则免疫评分越低,预后越差(P均<0.05)。肿瘤远处转移,则基质评分越低,预后越差(P<0.05)。高和低基质评分的生存曲线有交叉,对于临床特征和预后的意义不明显。免疫评分与五个免疫检查点的表达呈显著正相关(P均<0.05)。2.1212个差异mRNA参与了免疫反应,信号转导,炎症反应等与免疫相关的生物过程和细胞因子-细胞因子受体相互作用等通路。高和低免疫组有77个差异突变基因和1474个差异DNA甲基化位点。低免疫组有83.8%的突变类型的突变数高于高免疫组。高低免疫组相交的55个DNA甲基化正相关基因和200个负相关基因均富集在免疫相关的生物过程。3.单因素Cox回归模型鉴定出468个有意义的预后因素,包括386个mRNA,7个体细胞突变基因和75个DNA甲基化位点。LASSO-Cox、CoxBoost和RSFCox模型分别纳入了15个、21个和22个变量。在训练集和验证集中,RSF-Cox的C-index和AUC整体最高且IBS最低。在训练集中RSF-Cox模型的C-index和2年AUC显著高于LASSO-Cox模型(C-index:0.791 vs 0.729;2-year AUC:0.884 vs 0.774,P均<0.05)。RSF-Cox为相对最优模型。4.训练集、验证集和总人群低风险组的总生存率均显著高于高风险组(P均<0.05)。除HPV阳性人群外,其他亚组中低风险组的总生存率均显著高于高风险组(P均<0.05)。年龄、肿瘤远处转移、肿瘤组织学分级、风险评分为独立预后因素(P均<0.05)。风险评分的预测能力最高(1-year AUC:0.721;2-year AUC:0.693;3-year AUC:0.662)。多组学模型与人口学和临床特征的组合模型的预测效果有一定的提升(1-year AUC:0.796;2-year AUC:0.741;3-year AUC:0.719)。结论1.低免疫评分组的HNSC患者预后差。17个mRNA、2个体细胞突变基因和2个DNA甲基化位点是HNSC患者的免疫相关预后因子。2.RSF-Cox模型相较于LASSO-Cox和CoxBoost模型对于HNSC患者的预后预测效果最佳,对肿瘤高维数据的降维具有应用价值。3.≥65岁、肿瘤远处转移、肿瘤组织学分级为中分化、分化差、无分化和多组学高风险评分为HNSC患者预后的独立危险因素。人口学和临床因素与多组学数据的组合模型的预测效果较单纯多组学模型有一定的提升。