蓝细菌Synechococcus sp.PCC 7002基因组的拼接与注释

来源 :北京大学 | 被引量 : 0次 | 上传用户:zhqs1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
(Synechococcussp.PCC7002)是单细胞的海洋蓝细菌,长期以来一直被作为研究光合作用、呼吸作用以及生物合成途径的模式生物。由于其可以进行外源DNA的自然转化,因此非常适合于克隆的操作。由于可以在有甘油作为碳源存在的情况下进行光和异养,因此非常适合于基因克隆或突变后筛选的工作。生长速率很快,具有在强光下生长的能力,非常适合研究与光合作用相关的基因的特性。 测序过程中构造了多个测序文库,Fosmid文库的测序结果为填补空缺提供了主要的信息。除此之外,还利用了多种辅助方法和工具来找到重复叠连群之间的关系已进行拼接,比如T-LinkerPCR法和PGAAS工具包。 最终拼接得到一个3008041bp长度的染色体分子和6个质粒分子的序列,pAQ1(4809bp)pAQ3(16076bp)pAQ4(32037bp)pAQ5(38515bp)pAQ6(124029bp)pAQ7(186451bp)。共有3438个鉴定出来的开放读码框序列可能编码有功能的基因。染色体分子编码3041个基因,包括两组核糖体RNA基因和42个转运RNA。86.2%的预测出来的基因被注释了功能(69%)或者找到有相似性的序列(17.2%),13.8%的基因没有功能注释也没有在序列库中找到任何序列相似的基因。 分析了基因组中预测的高表达的基因的密码子使用情况,得到了其优化密码子表。根据此表计算出所有预测基因的密码子适应性检索的数值,由此来分析基因的水平转移和预测基因的表达情况。 使用马尔科夫聚类算法,Synechococcussp.PCC7002的3041个染色体基因中,有1117个是在其他7种已完成或接近完成注释的蓝细菌基因组中没有的。此外Synechococcussp.PCC7002缺少33个在其他7种蓝细菌都中都存在的基因。这两组基因构成了Synechococcussp.PCC7002的基因组的特点。
其他文献
2020年是全面建成小康社会和“十三五”规划的收官之年,是落实北京城市规划的关键之年,也是劳动模范评选的重要之年.西城区各级工会组织将突出党的政治建设,服务改革发展大局
期刊
本文通过对荣华二采区10
期刊
延河流域是典型的黄土高原丘陵沟壑区,长期以来过度开发与不合理的土地利用使生态系统服务提供能力下降。退耕还林还草工程实施以来,延河流域土地利用状况发生显著变化,表现为林
2011年起,《美术观察》将恢复[批评]栏目,拟每季度刊发一期,全年刊发四期(分别在3、6、9、12期刊发)。该栏目主要刊登美术界的专家、学者对当代中国美术创作、研究、教育、组
本研究以抗逆植物柠条为材料,参照已公布的GST的cds序列,根据序列保守区域设计引物,通过RT-PCR的方法获得了CkGST的cds片段,在此基础上通过3’和5RACE技术以及比对拼接获得全长的
本研究以造林中常见树种合作杨(P. Simoni×P. Pyramibalis c. v)为实验材料,采用不同处理方式——人为止血钳夹伤、扬扇舟蛾取食以及茉莉酸甲酯(Methyl Jasmonic acid, MeJA
本文就留守儿童该群体的权益保护工作的意义展开分析,主要是对留守儿童群体的权益保护的现状进行初步分析,希望能够对留守儿童群体的权益保护的有关措施与广大教育工作人员产
2020年,丰台区工会将坚持“守初心、担使命、强服务、重保障”的工作思路,为“妙笔生花看丰台”的美好愿景成为生动现实作出新的贡献.rn实现全面覆盖,解决非公领域工作短板.
期刊
  目前在植物体系中已经建立一些诱导表达系统,但是其效果均不理想。构建理想的诱导表达系统的关键点是优良、高效、特异的可调控启动子和理想型的化学诱导剂。  本研究针
化石能源储量的急剧降低和人类过度开采使用造成的严重环境污染已经成为目前人类经济和社会发展的主要问题之一,大力发展清洁无污染新能源已经成为解决能源告急和气候问题的关键解决途径。风能在地球上分布范围广,可开采储量巨大,清洁无污染,具有很大的商业化潜力和大规模应用前景。然而风能本身波动性、间歇性、反调峰性和难预测性等性质为风电的大规模并网带来了难题,对电能质量带来明显的负面影响,给风力发电甚至新能源的进