论文部分内容阅读
癌细胞或者正常组织中的细胞功能大多以高度模块化的方式进行,其潜在的普遍规律可以通过网络生物学的方法得到阐明。相互作用或调控网络的模块化研究将有助于进一步探索潜在的致病分子网络机制。网络生物学在系统水平上提供了一个了解每种疾病发生发展的分子机制以及其与化合物之间相互作用关系的方法。同时,网络生物学可用于预测转录本(Isoforms)或基因功能;与疾病相关基因以及药物药理与疾病表型之间的关系。从而用于发现人类疾病的潜在原因并提供有效的治疗途径。第一部分中,四种模块检测算法系统地研究了基于细胞的蛋白质相互用(PPI)网络的聚类。随后使用模块对最短路径和扩散相关性两种靶点基因预测算法经行优化,从而比较模块检测算法鉴定功能集群的能力。此外,通过模块中扰动基因的比例预测候选抗乳腺癌药物并用ClinicalTrials.gov中的病例和文献证据进行验证。结果表明,四种模块检测算法中,Walktrap(CW)聚类算法在比较研究中达到了最佳性能。第二部分中,用Broad-Novartis Cancer Cell Line Encyclopedia(CCLE)和The Genentech Cell Line Screening Initiative(gCSI)大型数据集的乳腺癌细胞系RNA-seq谱分别计算每对转录本之间的共表达,再利用meta分析框架来建立可信度高的乳腺癌类型特异性转录本共表达(BCIC)网络。然后,通过保留BCIC网络中与成瘤相关的转录本以及与其直接链接的转录本进而构建成瘤相关的直接(HRD)网络。接下来,我们探索了转录本生物标志物与HRD网络功能簇之间的关联。通过功能簇分析鉴定了关键的转录本水平的药物敏感性生物标志物,并通过将转录本表达谱与癌症基因组图谱(TCGA)中的乳腺癌临床信息相结合来进一步阐明药物敏感性标记物的表达量对临床治疗的影响。第三部分,“最短路径”药物靶标排序方法将乳腺癌类型特异性转录本共表达网络与CMap数据库中的MCF7细胞系中的基因扰动特征整合用以鉴定靶点主转录本。在用白血病癌症网络和HL-60细胞系中药物的差异表达数据来测试靶点主转录本算法的可靠性。接着用药物基因组数据集,蛋白质组学数据和APPRIS及STRING数据集定义的主要转录本,进一步分析了每个多转录本基因的靶点主转录本的特性。然后,基于共表达网络中的表达数据和拓扑特征测试DNMT1,MGEA5和P4HB4靶点基因的靶点主转录本。这些转录本是非APPRIS注释的主转录本。最后,通过计算机对接模拟了MGEA5的靶点主转录本翻译后蛋白对链脲佐菌素的亲和能力。本实验通过研究转录本水平的药物靶点为更有效药物靶向治疗铺平道路。第四部分中,通过对CCLE和gCSI数据库的RNA-seq表达数据应用meta分析框架来建立四种癌症的转录本水平的共表达网络,进而鉴定多转录本基因(MIG)的高链接度转录本(HDI)。然后,将HDI与蛋白质组学数据鉴定的转录本以及癌症的预后和药物敏感性预测证据进行了比较。同时,分析各种癌症类型细胞系中相同基因的HDI和非HDI(nHDI)的表达水平和药物反应之间的关联。这些结果表明,转录本共表达网络鉴定了每个多转录本基因的HDI和基于癌症类型的HDI具有复杂的性质,并显示了HDI可以作为癌症治疗的新治疗靶标的潜力。