论文部分内容阅读
目的:自噬是维持机体内环境稳定的重要生理活动之一。当前研究已证实,自噬同恶性肿瘤的形成发展存在显著联系。本研究进一步挖掘了自噬相关长链非编码RNA(ATRlncRNA)在结直肠癌中的潜在预后价值及相关分子调控关系,为结直肠癌预后监测,个体化治疗及肿瘤进展机制提供全新的观点。方法:我们对自噬基因(ATG)和TCGA结直肠癌lncRNA表达矩阵进行Pearson相关性分析,获得了结直肠癌ATRlncRNA表达矩阵,并构建了ATRlncRNA介导的竞争性内源性RNA(ceRNA)网络。从TCGA获得的临床样本以1:1的比例被分为training组和test组,从GEO获得数据集作为validation组。对training组生存数据及其ATRlncRNA表达矩阵进行单因素Cox回归分析、LASSO回归分析进行校正,得到预后相关的ATRlncRNA,然后对预后相关的ATRlncRNA表达矩阵进行多因素cox回归分析,得到基于ATRlncRNA的预后模型,同时基于预后模型风险评分所得中位值,把标本分别归入高风险组和低风险组。基于此预后模型对training组样本进行Kaplan-Meier生存分析、独立预后分析、多因素ROC曲线以探究其该模型的预后价值,相关结果由test组及validation组加以验证。对高低风险组基因表达矩阵进行基因集富集分析(GSEA)以分层探究在结直肠癌中现有的基因功能定位。基于ATRlncRNA的预后模型,我们对结直肠癌样本进行包括22类免疫细胞和肿瘤免疫检查点(PD-1、CTLA-4和TIM-3)的免疫浸润分析。此外,使用ln CAR数据库对预后模型的六种ATRlncRNA在肿瘤和正常组织的表达差异进行验证,并对肿瘤干细胞(CSC)指数和肿瘤微环境(TME)评分与预后模型的六种ATRlncRNA表达量之间进行Spearman相关性分析以进一步探究ATRlncRNA在细胞层面上与结直肠癌进展的关系。(1)从HADb数据库中共获得210个结直肠癌自噬基因,将此TCGA结直肠癌ATG表达矩阵与TCGA结直肠癌lncRNA表达矩阵进行Pearson相关性分析,共获得3145个ATRlncRNA,并完成ceRNA了网络(由ATRlncRNA介导)的构建,内含ATRlncRNA、mRNA与miRNA的量依次是30个、29个、18个。(2)从TCGA数据库筛选获得的496个结直肠癌样本按照1:1分为training组(n=248)和test组(n=248)。从GEO获得的294个结直肠癌样本作为validation组。对training组实施单因素Cox回归分析、LASSO回归分析与多因素Cox回归分析,获得基于六种ATRlncRNA(ALMS1-IT1、FGD5-AS1、FLG-AS1、MIR210HG、MIR31HG及PINK1-AS)的预后模型。对training组、test组和validation组样本进行Kaplan-Meier生存分析,观察到高风险组样本生存率低于低风险组(P<0.05)。对training组、test组和validation组独立预后分析中,获得了两个独立预后因素:年龄和预后模型的风险评分,证明预后模型可以直接作为独立的因素预测患者预后。包含预后模型风险评分的多因素ROC曲线在training组、test组和validation组分别为0.711,0.776和0.693,显示了该模型良好的准确性。(3)在对高风险组和低风险组进行的GSEA中,高风险组的基因集主要活跃于效应特征基因集“Hypoxia(缺氧)”,在KEGG通路中无富集;而低风险组基因集则富集于KEGG通路,包括“Peroxisome(过氧化物酶体)”,“The citrate cycle(三羧酸循环)”和“Other glycan degradation(其它聚糖降解)”,而在效应特征基因集中无反应。(4)对TCGA结直肠癌高风险组和低风险组的免疫浸润分析中,浆细胞和记忆静息CD4+T细胞在低风险组的含量均高于在高风险组的含量,对22类免疫细胞相对含量和预后模型风险评分进行Spearman相关性分析显示,浆细胞和记忆静息CD4+T细胞的相对含量与风险评分均呈负相关。PDCD1(PD-1)、CTLA4(CTLA-4)及HAVCR2(TIM-3)的表达量在高风险组的含量均高于低风险组,针对上述PD-1、CTLA-4与TIM-3的表达水平同预后模型风险评分间的联系,实施Spearman相关性分析发现,后两者的表达水平正向相关于预后模型风险评分。(5)对预后模型的六种ATRlncRNA表达量进行差异验证及与CSC指数和结果:TME评分进行Spearman相关性分析中,证实在ALMS1-IT1与MIR31HG的表达水平上,相较正常组织,肿瘤组织显著偏高,FGD5-AS1、FLG-AS1、MIR210HG及PINK1-AS的表达量被验证在正常组织中比在肿瘤组织中表达量更高;CSC指数与ALMS1-IT1的表达量呈正相关,与FGD5-AS1、FLG-AS1和MIR31HG的表达量负相关;基质评分与FGD5-AS1、FLG-AS1和MIR31HG的表达量呈正相关,免疫评分和综合评分与FLG-AS1和MIR31HG的表达量呈正相关,与ALMS1-IT1的表达量呈负相关。结论:基于六种ATRlncRNA构建的预后模型体现了良好的临床适用性及准确性,可以成为独立预测结直肠癌患者预后的指标。由ATRlncRNA介导的ceRNA网络充分说明了ATRlncRNA同其他分子间的潜在互作关系。高风险组和低风险组的分层GSEA分析进一步探索了与结直肠癌进展有关的生物学功能,为个体化治疗提供了新的观点。基于ATRlncRNA的预后模型与肿瘤免疫浸润相关性分析验证免疫细胞对患者预后的表征。此外,预后模型的六种ATRlncRNA的表达量与CSC指数及TME评分的相关性分析为研究结直肠癌进展提供了新的线索。