论文部分内容阅读
由不对称复制方式造成的前导链和滞后链在多种生物特征上体现出了链偏差。随着大规模高通量测序的发展,在越来越多的基因组中发现了该现象,搞清楚两条复制链间的差异对理解复制机制有重要意义,但目前还没有文章系统的研究各类链偏差及其内在机制。因此本文就细菌复制链偏差进行了全面探讨,整个内容分为以下三个部分:1.对广泛存在于细菌当中的各类复制链偏差做综述和研究。共讨论了5种链偏差,包括基因位置,开放阅读框ORF的数目,碱基组成,碱基替代率以及基因长度。分别对每一种偏差总结了研究现状及偏差内在机制(从突变和选择两方面讨论)并且以Clostridium acetobutylicum ATCC 824为例来分析相关偏差。结果显示前导链和滞后链在ORF数目及基因长度方面没有明显差异,而在其他三个特征中存在显著偏差。2.对于基因组的研究,首先要基于序列组成,组成特征决定了结构特征。因此这部分我们重点研究了链偏差当中的组成偏差及其各种影响因素。结果发现:(1)专性胞内菌比其他细菌在总体上有更强的组成偏差。(2)19个细菌门当中,Fusobacteria的物种具有最强的组成偏差,Firmicutes次之。(3)翻译选择强度和增代时间分别对组成偏差的影响都不明显。(4)与组成偏差存在显著负相关的因素有GC含量,基因组大小,重组率以及COG功能类的A,C,I,Q类。(5)与组成偏差存在强烈正相关的特征有前导链基因密度,COG功能类的D,F,J,L,V类。(6)在所有与组成偏差相关的生物因素中前导链基因密度和COG功能类的C子类贡献率较大。因此链组成偏差的产生与多种因素及其不同比重都有密切关系。3.密码子使用偏性广泛存在于原核生物与真核生物中,具有重要的生物学意义,而在某些细菌中,链组成偏差的程度强烈到足以使前导链和滞后链的基因存在分离的密码子使用。因此,这里建立了一个密码子对应分析数据库CCD。该数据库分别采用对应分析CA和群内对应分析WCA对267个物种进行了研究,结果发现有59个物种的前导链和滞后链基因具有显著的密码子使用偏差。并以达氏螺旋体(Borrelia duttonii Ly)为例介绍了CCD数据库的使用方法。该数据库可以通过网址http://cobi.uestc.edu.cn/services/ccd/免费访问。这篇论文从横向与纵向两个层面就细菌复制链偏差做了详尽探讨,上千个物种的分析结果可以对该问题有一个全面系统的了解。