论文部分内容阅读
目的:本研究旨在通过生物信息学方法,筛选与肝细胞癌(Hepatocellular carcinoma,HCC)预后有关的细胞焦亡相关长链非编码RNA(Pyroptosis-related long non-coding RNA,pylncRNA),从而构建预后模型。并进一步探索该模型在评估免疫细胞浸润和预测化疗药物敏感性等方面的应用价值。方法:从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库下载374例肝细胞癌和50例癌旁组织的转录组数据和临床病理信息;从分子特征数据库(Molecular Signatures Database,MSig DB)和既往文献中检索得到51个细胞焦亡基因。首先,使用Perl软件从TCGA转录组数据中提取出细胞焦亡基因和lncRNA。随后,使用R软件对提取出的细胞焦亡基因和lncRNA进行相关性分析(筛选标准:相关系数|cor|>0.4,P<0.001),获得pylncRNA。然后,以|log2FC|>1且FDR<0.05为筛选标准,应用R软件筛选出在肝细胞癌与癌旁组织中差异表达的细胞焦亡相关lncRNA(Differentially expression pyroptosis-related long non-coding RNA,DEpylncRNA)。将DEpylncRNA的表达数据与生存数据合并,删除生存信息不完整的样本,通过单因素Cox分析筛选出与肝细胞癌预后相关的pylncRNA。接下来,按照1:1的比例将TCGA肝细胞癌患者随机分为训练队列和验证队列。在训练队列中,基于单因素Cox分析所得到的预后相关的pylncRNA,应用LASSO回归分析最终鉴定出与肝细胞癌预后最为相关的pylncRNA并以此构建预后模型。高、低风险组人群根据风险评分的中位值定义;主成分分析(Principal component analysis,PCA)、t-分布领域嵌入(t-distributed stochastic neighbor embedding,t-SNE)分析、Kaplan-Meier(K-M)生存分析和受试者工作特征(Receiver operating characteristic,ROC)曲线被用于评估模型预测的准确性。模型的稳定性与普适性在验证队列和总队列中进一步验证。此外,基于模型所区分的高、低风险组,ESTIMATE免疫浸润算法和单样本基因富集分析(single sample gene set enrichment analysis,ss GSEA)被用于评估高、低风险组人群免疫细胞的浸润情况;“p RRophetic”药敏性分析包被用于评估高、低风险组人群对化疗药物的敏感性;GSEA富集分析软件被用于探寻高、低风险组中的差异激活的生物学通路。最后,利用GEPIA数据库验证了模型中pylncRNA的表达情况并探索了其生存预后价值。结果:(1)通过相关性分析得到了763个pylncRNA,随后对这些pylncRNA进行差异分析得到524个DEpylncRNA,其中上调的pylncRNA有518个,下调的有6个。(2)对524个DEpylncRNA进行单因素Cox回归分析,筛选出120个与肝细胞癌预后相关的pylncRNA。(3)按照1:1的比例,将TCGA的肝细胞癌患者随机分成训练队列(n=184)和验证队列(n=181),LASSO回归分析在训练队列中鉴定出4个与肝细胞癌预后最为相关的pylncRNA(PXN-AS1、AL031985.3、MKLN1-AS和AC025178.1)并以此构建预后模型。根据预后模型计算出每一个样本风险评分,并基于中位数风险评分将训练队列患者分成高、低风险组。PCA和t-SNE分析显示该模型可以准确区分高、低风险组人群;K-M分析显示高风险组患者的预后较差(P<0.001);ROC曲线显示模型预测肝细胞癌患者1~5年生存率的ROC曲线下面积(Area Under Curve,AUC)分别为0.752、0.741、0.729、0.704和0.710。并且验证队列和总队列的分析结果与训练队列的结果保持较高的一致性。此外,临床亚组生存分析结果显示该模型适用于具有不同临床特征的肝细胞癌患者。(4)单因素和多因素Cox分析结果显示TNM分期中的III期、IV期以及风险评分是TCGA肝细胞癌患者的独立预后因素;基于TNM分期和风险评分两个变量开发的nomogram列线图能更直观和有效地预测肝细胞癌患者的预后。(5)基于模型所区分的高、低风险组,ESTIMATE分析结果显示,高风险组的基质评分显著低于低风险组,且肝细胞癌患者的基质评分与风险评分呈负相关;ss GSEA分析结果显示,10种免疫细胞的浸润丰度在高、低风险组中存在差异。(6)药敏性分析结果显示高风险组患者对于顺铂、多柔比星、吉西他滨、丝裂霉素C和紫杉醇的敏感性较高,而低风险组患者对厄洛替尼、吉非替尼和索拉非尼的敏感性较高。(7)GSEA分析结果显示JAK-STAT信号通路、趋化因子信号通路、MAPK信号通路、和Toll样受体信号通路在高风险组中显著上调。(8)GEPIA数据库的结果显示,相比于正常肝组织,PXN-AS1、AL031985.3和MKLN1-AS在肝细胞癌中高表达,而AC025178.1在肝细胞癌中低表达;并且,K-M分析结果显示PXN-AS1、AL031985.3和MKLN1-AS的高表达与肝细胞癌的不良预后相关。结论:基于4个pylncRNA,我们成功构建了一个肝细胞癌预后模型,预测效能较好。该模型不仅有助于评估不同风险人群肿瘤微环境中免疫细胞的浸润情况,而且能为肝细胞癌患者的临床化疗提供有效的指导。此外,本研究发现PXN-AS1、AL031985.3和MKLN1-AS可能是肝细胞癌预后不良的生物标志物。