论文部分内容阅读
目的:胶质母细胞瘤(GBM)是神经胶质瘤中侵袭性最强的一种亚型,恶性程度高,侵袭性强,预后极差,平均存活时间为10-12个月。考虑到每个GBM患者的整体生存率(Overall survival OS)是个体治疗的关键因素,本研究旨在分析GBM的基因表达谱,寻找与GBM预后不良相关差异性基因,对差异基因进行风险评估,揭示与GBM肿瘤诊断及预后相关的基因。方法:首先,从癌症基因组图谱(The Cancer Genome altas TCGA)数据库中下载胶质母细胞瘤数据集,从中获得174例患者的基因表达和临床信息。使用R语言中limma软件包对胶质瘤及相应的正常标本进行差异性表达分析,筛选出差异表达的IncRNA和mRNA;然后我们使用博豪在线富集工具(http://enrich.shbio.com/)功能富集分析差异表达的基因,相关的内容主要包括:1)基因本体(Gene Ontology,GO):分子功能(Molecular Function,MF)、细胞组成(Cellular Component,CC)、生物过程(Biological Process,BP);2)京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)。再使用R/Bioconductor软件中的survival软件包对差异基因表达进行一对一的单变量生存分析,首先对差异基因进行Cox单因素分析,选择出P值小于0.05的基因表达量。再接着将其中会明显影响到患者生存及预后的变量进行多因素回归。基于如下表达式建立预后风险评分模型:风险评分=基因1×β1的表达水平+基因2×β2的表达水平+…+基因n×βn的表达水平;β为多元Cox回归计算的回归系数模型。随后,对每一组患者进行预后风险评分:将TCGA-GBM患者按危险评分中位数分为高危组(高危评分)和低危组(低危评分)。同时,为对模型的有效性进行验证,而将患者随机划分为训练组和验证组,二组的人数相一致,其中训练组基于危险水平而划分为高、低危组。接着利用相应软件工具包确定出分组边界值,基于所得结果而建立起二组的Kaplan-Meier曲线。接着利用这种曲线来进行预后分析,用双侧对数秩检验评价高危组患者和低危组患者间的生存差异。然后以中位危险评分为界,将160名患者分为高危组、低危组,通过K-M曲线对二组患者进行生存分析,在此基础上对比总生存率指标。再然后将筛选出的基因分别进行K-M生存分析,评估预后相关基因表达水平与OS的关系。再将筛选出的目标基因分别纳入基因表达谱交互分析(GEPIA)数据库及人类蛋白质图谱中进行验证。最后根据选择出的基因表达水平,使用R软件包“rms”生成一个预后列线图,评估其对患者预后的贡献。结果:我们在模型中鉴定了8个预后相关基因,这些基因具有显著的预后价值。在基因表达谱交互分析(GEPIA)数据库中进一步验证了上述8个基因在肿瘤和正常组织中的差异表达,包括163例GBM和207例正常组织,结果显示,表明TBX15、TGFBI、STEAP3、NELL1和CLEC5A在GBM组织中显著上调,但BEST3和HAS1在GBM组织中显著下调。然后,构建了K-M生存曲线,以评估预后相关基因的表达水平与OS之间的关联。结果表明NELL1、TBX15、TMEM233、TGFBI、STEAP3、CLEC5A低表达组和HAS1、BEST3高表达组(所有8个基因的p<0.05),均相对而言具有较好的预后。结论:本研究构建的NELL1、TBX15、TMEM233、TGFBI、HAS1、STEAP3、BEST3和CLEC5A 8个基因组成的预后基因模型可以作为GBM患者的预后标志物,能够更好地预测患者的整体生存率,相对于单个基因组有更高的灵敏性,所有这些都可以作为GBM治疗的潜在靶基因,为癌症研究人员提供良好的参考。