论文部分内容阅读
肿瘤是人最主要的致死性疾病,其发生发展过程中均伴随着大量的基因组改变。当同源染色体片段相对于另一条同源染色体的拷贝数增加或减少时,伴随着一个现象的发生,等位基因不平衡。如果被扩增的同源染色体的片段携带着比另一条同源染色体更有利于肿瘤生长的遗传变异位点,则此片段在肿瘤细胞生长过程中有选择性优势。高通量测序技术的快速应用与精准医疗研究的快速发展,产生了海量基因组学数据,现在我们可以较容易且准确的获得整个基因组的完整信息。本研究从一个独特的视角来探究四种高发肿瘤(乳腺腺癌、结直肠腺癌、肺腺癌和前列腺癌)发展过程基因组的变化,以期为肿瘤的临床预后提供理论依据。为了找到在肿瘤细胞生长过程中具有选择性优势的基因座,我们构建了一个贝叶斯概率模型,用于评估在肿瘤群体中频繁发生的等位基因不平衡。在这个研究中,我们使用大型肿瘤公共数据库TCGA提供的肿瘤组织与正常组织配对的外显子测序数据,遗传变异位点数据库NCBI dbSNP Build 144的外显子区域位点,进行了等位基因不平衡性位点的评估。首先,我们从两个方面来验证了模型,一是验证样本中等位基因比例与评估的等位基因比例的一致性,二是通过体细胞拷贝数变异与等位基因不平衡的关联性来验证。其次,我们对评估的等位基因不平衡基因座进行功能预测,比较等位基因不平衡基因座和平衡基因座的功能富集度,发现对氨基酸、蛋白质编码等有影响的功能位点都富集在等位基因不平衡基因座中。再次,我们进行了等位基因不平衡与体细胞拷贝数变异的关联分析,发现体细胞拷贝数变异越频繁的区域等位基因不平衡事件也越频繁发生。然后,通过基因功能富集分析,包括染色体位置,KEGG通路,GO生物过程,我们发现不平衡基因富集在癌症相关的重要生物通路中,例如,四个肿瘤的不平衡基因都显著富集在“KEGG PATHWAYSIN CANCER”、“KEGG ECM RECEPTOR INTERACTION,”、“KEGG FOCAL ADHESION”等肿瘤细胞生长与转移相关的KEGG通路中。最后,我们还验证了 DNA水平的等位基因不平衡与表达不平衡的关联,发现基因表达不平衡的发生还有其他因素在起作用。肿瘤生长是一个复杂的过程,本研究通过对肿瘤基因组的等位基因不平衡性研究,以期为肿瘤发生机制和临床预后提供参考信息。