论文部分内容阅读
随着人类基因组测序工作的完成,以及越来越多的原核及真核生物的全基因组序列数据的累积,对基因组的研究已经步入了后基因组(post-genomics)时代,在后基因组时代,基因组研究的重心将转向基因功能(functional genomics),
基因组上下文方法就是众多后基因组时代的生物信息学方法之一。其通过同时考察多个基因组来获得基因及其编码的蛋白质之间的功能关联,这种功能关联有着许多应用,除了在传统的在蛋白质相互作用中应用,基因组上下文方法还可以应用在比较基因组学等方面,另外,我们通过比较由基因组上下文方法绘制的网络构建了物种的进化树,证明了这种基因间的关系足以描述物种分类上的差异。另外,基于这些方法的广泛使用,有必要为这些方法提供自动化的程序来提高分析效率。
本文主要包括以下三个方面:
1.基因组上下文分析方法的介绍。介绍三种基因组上下文分析的方法,包括系统发生谱方法(phylogenetic profile method),基因邻居方法(gene neighbor method)以及基因融合(gene fusion method)的基本原理,以及各自的统计学的检验方法。
2.基因组上下文网络构建的工具。通过对三种基因组上下文分析方法的实现,制作了一个可以用来计算,绘制以及展示由基因组上下文分析方法得到的基因间关系的网络的工具。这是对现有的基于网络的数据库的一个很好的补充,使得用户可以按照自己的需要得到网络以供进一步的分析工作。
3.基于基因组上下文方法的进化分析。基于基因组的数据,我们第一次利用反映基因间关系的网络构建了含有195个物种的生命之树。这部分工作假定了生物体是个系统,系统各部分之间的关系才是生物体的本质。这种视角让我们验证了分类学里面的一些传统观念,同时也看到了一些和过去不一样的结论,比如高GC含量的革兰氏阳性菌起源,同时还对一些物种的传统分类提出了异议。我们的工作证明了从基因间关系重构生物历史的可能,对传统的分类学提出了挑战。我们的结果说明基因间的关系足以确定一个物种的分类。