论文部分内容阅读
利用 Perl,C++语言编写了鉴定和分析简单重复序列的一系列程序,在水稻粳稻日本晴第 4 号染色体上鉴定了 1844 个简单重复序列(SSRs)(≥20 bp),其重复单位长度为 1-6 bp。简单重复序列在第 4 号染色体上的发生频率为平均18.8kb 有 1 个简单重复序列,在长臂和短臂上分别是平均 23.8kb 和 16kb 有 1个简单重复序列,在着丝粒的核心区域却没有发现简单重复序列。虽然(AT)n 简单重复序列是最多和长度变化最大的,但是却没有在外显子中发现。富含 GC的 3 碱基简单重复序列在编码序列中是最多的,占编码序列中全部简单重复序列的 71.69%。224 个简单重复序列被鉴定与其它的重复序列相关,其中大多数是(AT)n 简单重复序列。通过比较亚洲栽培稻的亚种籼稻和粳稻之间简单重复序列的变化,我们发现简单重复序列可以用来鉴定籼稻和粳稻的遗传差异,并为研究相近物种的进化提供了大量信息。亚种染色体水平上简单重复序列的比较信息也可以用来发现新的分子标记。 在拟南芥全基因组中共鉴定了 5652 个简单重复序列,发生频率为平均20.6kb 有 1 个简单重复序列,各染色体之间简单重复序列的密度基本一致。拟南芥的 27480 条编码序列中,只有 677 条编码序列含有 725 个简单重复序列,其中的 3 碱基简单重复序列大多对应的是小的亲水性的氨基酸。在拟南芥和水稻第 4 号染色体对应的高度保守的基因中,简单重复序列却并不保守。水稻全基因组共发现 23080 个简单重复序列,发生频率为平均 15.52kb 有 1 个简单重复序列。水稻基因组序列中 0.21%来自简单重复序列,而拟南芥中只有 0.13%。水稻的全基因组和基因中简单重复序列的密度都比拟南芥大,这可能是水稻基因组序列比拟南芥大的原因之一。通过比较拟南芥和水稻之间简单重复序列的 3<WP=5>水稻基因组第 4 号染色体简单重复序列的遗传分析及比较基因组学研究差异,可以推论:不但不同物种的基因组对简单重复序列的偏好性不同,而且不同物种的编码序列对简单重复序列的偏好性也不同。在水稻和拟南芥中都发现了一些嵌套性的卫星序列。 通过对 BAC OSJNBa0039K24 的分析,鉴定了 1 个含 6 个过氧化物酶基因的基因簇。这 6 个过氧化物酶基因都与 EST 高度匹配,而且转录方向都相同,被依次命名为 pod1、pod2、pod3、pod4、pod5、pod6。将同源的粳稻和籼稻过氧化物酶基因簇进行比较,发现 osp1 与 pod1、osp2 与 pod2、osp3 与 pod4、osp4与 pod5、osp5 与 pod6 的相似性最高,而且相似性以 osp1 → osp5 和 pod1 →pod6 的梯度下降。序列配对和进化树分析表明一系列的串联基因复制导致了该基因簇的形成,即在进化过程中依次发生了 osp1→osp2→osp3→osp4→osp5 和pod1→pod2→pod4→pod5→pod6 的基因复制事件。pod3 是线粒体蛋白,可能比其它的植物过氧化物酶更古老。