论文部分内容阅读
神经胶质瘤简称胶质瘤,是颅内发生率最高的恶性肿瘤,约占原发性中枢神经系统肿瘤的45%左右,其治疗始终是神经外科中的一个棘手问题,约77%的恶性胶质瘤患者在确诊后1年内死亡,尤其是胶质母细胞瘤,其中位生存期仅仅只有14.6个月。胶质瘤的发生和恶性进展是一个多步骤的进行性积累和多基因改变的过程。同一组织病理学肿瘤的分子途径也不同,可分为不同的分子亚型。不同类型的胶质瘤可能具有不同的分子发病机制。2006年美国癌症基因组图谱计划(TCGA)以恶性程度最高、预后最差的胶质母细胞瘤为切入点,进行了多平台、高通量的基因组分析,取得了一系列重要突破。本项目目的是通过生物信息学方法利用TCGA数据库中的胶质瘤转录组数据对神经胶质瘤发生、发展相关的分子标志物及与预后的关系进行分析。主要使用的工具为perl、R,具体工作如下:1.通过使用命令行的方式对数据库中的胶质母细胞瘤转录组数据、低级别胶质瘤数据进行下载,及癌旁样本数据整理及合并,共获得了169例胶质母细胞瘤转录组数据、529例低级别胶质瘤样本的转录组数据、5例癌旁样本转录组数据;首先对癌旁与胶质母细胞瘤、癌旁与低级别胶质瘤、低级别胶质瘤与胶质母细胞瘤进行差异基因分析,筛选标准为|Fold Change|≥4、padj<0.01,分别获得癌旁与胶质母细胞瘤组间差异基因6185个差异表达基因(上调差异基因3499条,下调差异基因2686条),癌旁与低级别胶质瘤组间差异基因筛选出1939个差异表达基因(上调差异基因614条,下调差异基因1325条),低级别胶质瘤与高级别胶质瘤组间差异基因3007个差异表达基因(上调差异基因2183条,下调差异基因824条)。然后通过使用韦恩图的分析方式对癌旁与胶质母细胞瘤差异基因组、癌旁与低级别胶质瘤差异基因组、低级别胶质瘤与高级别胶质瘤差异基因组进行共差异基因分析,获得169个癌旁、胶质母细胞瘤、低级别胶质瘤的共差异表达基因。对169个共差异基因进行进一步筛选,去除非编码基因,获得135个编码共差异基因。2.为了了解共差异基因主要涉及的相关生物学过程,通过使用生物学信息注释及可视化数据库(The Database for Annotation,visualization and integrated discovery,DAVID)对这135个共差异编码基因进行GO基因富集分析,筛选标准为FDR小于0.05;通过分析了解到这些差异基因主要涉及质膜组成、离子通道及信号转导、细胞周期相关的生物学过程,涉及到这些生物学过程的基因数量为69条。3.为了进一步了解基因之间相互协调作用影响的生物学功能,对共差异表达基因进行Pathway分析,以确定共差异表达基因参与的主要生化代谢途径和信号转导机制。结果显示,共差异基因主要涉及到神经活性配体-受体相互作用、钙离子信号通路、烟瘾、毒瘾、昼夜夹带、环磷酸腺苷信号通路、血清素能性突触、多巴胺能突触、γ-氨基丁酸能突触、逆行内源性大麻素信号转导、长时程增强、“安非他命毒”、谷氨酸能突触、肌萎缩侧索硬化症、醛固酮合成与分泌、“突触囊泡循环、胆碱能突触等的生化代谢途径和信号转导通路,涉及到这些通路的共差异基因数量为34个。4.为了进一步筛选出共差异基因中的真正的关键基因,使用蛋白质相互作用数据(https://string-db.org)和R对共差异基因进行PPI网络分析。结果显示,结合GO、KEGG显著性相关的基因结果,确定10个真正的关键基因:SYT1、GABRG2、GRM4、MCHR2、GRIN1、CAMK2A、GRIN2B、HTR2A、CACNA1B、RYR2。5.为了进一步了解与胶质瘤预后密切相关的关键基因,使用R软件对关键基因与预后的关系进行分析。结果显示,上述筛选的10个关键基因均与预后密切相关,其中尤其以CACNA1B、GRIN1、HTR2A、GRM4这4个关键基因最高:CACNA1B(p=0)基因高表达的2年生存率为83.93%,低表达的2年生存率为53.2%;GRIN1(p=0)基因高表达的2年存活率为83.5%,低表达的2年生存率为53.58%;HTR2A(p=0)基因高表达的2年存活率为84.2%,低表达2年生存率为54.21%;GRM4(p=0)基因高表达的2年存活率为84.4%,低表达的2年生存率为53.5%;