论文部分内容阅读
(Synechococcussp.PCC7002)是单细胞的海洋蓝细菌,长期以来一直被作为研究光合作用、呼吸作用以及生物合成途径的模式生物。由于其可以进行外源DNA的自然转化,因此非常适合于克隆的操作。由于可以在有甘油作为碳源存在的情况下进行光和异养,因此非常适合于基因克隆或突变后筛选的工作。生长速率很快,具有在强光下生长的能力,非常适合研究与光合作用相关的基因的特性。
测序过程中构造了多个测序文库,Fosmid文库的测序结果为填补空缺提供了主要的信息。除此之外,还利用了多种辅助方法和工具来找到重复叠连群之间的关系已进行拼接,比如T-LinkerPCR法和PGAAS工具包。
最终拼接得到一个3008041bp长度的染色体分子和6个质粒分子的序列,pAQ1(4809bp)pAQ3(16076bp)pAQ4(32037bp)pAQ5(38515bp)pAQ6(124029bp)pAQ7(186451bp)。共有3438个鉴定出来的开放读码框序列可能编码有功能的基因。染色体分子编码3041个基因,包括两组核糖体RNA基因和42个转运RNA。86.2%的预测出来的基因被注释了功能(69%)或者找到有相似性的序列(17.2%),13.8%的基因没有功能注释也没有在序列库中找到任何序列相似的基因。
分析了基因组中预测的高表达的基因的密码子使用情况,得到了其优化密码子表。根据此表计算出所有预测基因的密码子适应性检索的数值,由此来分析基因的水平转移和预测基因的表达情况。
使用马尔科夫聚类算法,Synechococcussp.PCC7002的3041个染色体基因中,有1117个是在其他7种已完成或接近完成注释的蓝细菌基因组中没有的。此外Synechococcussp.PCC7002缺少33个在其他7种蓝细菌都中都存在的基因。这两组基因构成了Synechococcussp.PCC7002的基因组的特点。