论文部分内容阅读
多形性胶质母细胞瘤(Glioblastoma Multiforme,GBM)在世界范围内是成人中枢神经系统中最常见并且恶性程度最高的原发性肿瘤,在全部类型的脑胶质瘤中能够占到50%以上。尽管当今的治疗手段不断进步,但是在临床实践中仍未能取得令人满意的效果,GBM患者的预后很差,中位生存期约为12个月。为了改善GBM患者的预后,肿瘤科学家们进行了大量的研究,但是到目前为止,其病因、发病机制和预后状况仍然尚未完全明了。大量的研究表明多形性胶质母细胞瘤是一个多基因参与、多蛋白质参与、经过多阶段才最终形成的极其复杂的生物学现象。然而,究竟是哪些基因、蛋白质对多形性胶质母细胞瘤患者生存时间具有一定的影响不明确。因此,探索这些因素对改善多形性胶质母细胞瘤患者的预后及靶向治疗具有重要意义。本文对多形性胶质母细胞瘤致病机理进行研究,构建了一个多维度多形性胶质母细胞瘤研究模型,旨在找出对GBM有重要影响的关键蛋白质,其本文的主要工作如下:1、筛选GBM关键基因。该部分主要分为3个步骤:(a)数据收集与预处理。(b)获取差异基因。对预处理后的数据,分别利用CoxLasso算法、CoxSis算法以及CoxSisLasso算法进行生存分析,寻找对GBM患者生存时间有显著性影响的差异基因;(c)获取关键基因。对三种算法获得的差异基因取交集,作为最终的GBM关键基因。2、RPPA(Reverse Phase Protein Arrays)实验设计及数据预处理。该部分主要分为2个步骤:(a)根据实验设计原则,RPPA实验利用反相蛋白质阵列技术在两个细胞系U251和LN229中通过改变AEBP1(Adipocyte Enhancer Binding Protein 1)基因表达量,来观察蛋白质的表达量,从而获得RPPA数据;(b)集成三种数据预处理方法,即NormLinear、NormLog2和NormLog2_MedianCentered。数据分布常为偏态、标准差较大,不同数据预处理方法的分析结果中会出现一定的随机误差。因此,本文对RPPA原数据集成三种预处理方法,并对预处理数据分析的结果取交集作为最终结果,这对结果的精确性及可信度都会有很大的提高。3、筛选GBM关键蛋白质。该部分主要是基于第1步筛选出的关键基因AEBP1,推导出与AEBP1基因相关的关键蛋白质,即对GBM有影响的关键蛋白质。主要分为2个步骤:(a)获取显著性差异的蛋白质。由于生物实验周期长、耗费高,导致本文RPPA数据的样本量太小,所以用一般的统计学检验来获得有显著性差异的蛋白质会使结果有一定的偏差。本文采用置换检验和区组设计结合的方法来解决样本量小的问题,进而获得显著性差异的蛋白质;(b)关键蛋白质。为了GBM的靶向制药,将获取的差异蛋白质进一步利用Cox回归算法、Conditional Quantile Screening算法及Cbioportal网站三种方法进行生存分析,然后,对三种算法获得的结果取交集,作为对GBM患者生存时间有显著性影响的关键蛋白质。本文通过真实的生物实验数据,构建了一个多维度研究模型,筛选出GBM的关键基因和关键蛋白质。总之,它可以提高对GBM致病机理的认识,改善患者预后。这样不仅为GBM靶向治疗打下基础,而且可以为更深一步的理论研究提供新的思路。