论文部分内容阅读
对一个物种而言,完整的高质量的基因组序列是其广义研究中不可估量的宝贵资源,并且是基因组学、基因功能、分子和进化研究的坚实基础,基因组参考序列的质量在一定程度上也体现了该物种的研究进展和水平。水稻是重要的粮食作物,在遗传学、分子生物学及基因组学研究中具有重要地位,同时也是第一个全基因组测序的禾谷类作物。粳稻品种日本晴和籼稻品种93-11分别通过克隆连接克隆法(clone-by-clone)和全基因组鸟枪法(WGS)进行了全基因组测序,其中日本晴参考序列被公认为现有作物基因组序列中质量最高的,但其中仍然存在着组装错误和空缺问题。将93-11和中花11物理图谱中BAC末端序列与日本晴参考序列(IRGSP build5)分别进行比对的结果发现,284和257个位置分别存在2个或2个以上反向匹配末端。由此推测这些位置中可能存在日本晴序列中的倒置组装错误。为了排除不同品种基因组差异的影响,我们将日本晴物理图谱中的BAC末端序列与日本晴参考序列进行比对。结果显示,371条BESs呈两个或两个以上的组合反向匹配到日本晴基因组序列上的123个位置。这些位置被我们视为潜在的倒置组装错误。对其中27个含有双末端匹配的位置进一步分析的结果表明,四个由反向重复序列导致的倒置组装错误分别位于04和11号染色体上,在此基础上,我们对这些位置进行了实验验证和纠正。这种方法也能够被应用于改进其它基因组序列的组装质量。日本晴基因组序列中的空缺问题同样制约了序列质量的提升。现有版本的日本晴序列中仍然存在45个空缺,其中9个是着丝粒序列,36个是染色体臂物理空缺。目前应对物理空缺还缺乏行之有效的闭合方法。我们利用实验室已有的水稻93-11、珍汕97、明恢63和中花11四个品种的物理图谱,与日本晴参考序列进行比对定位,找出物理图谱中可以覆盖日本晴参考序列空缺的克隆重叠群,并得到这些克隆重叠群中可以覆盖或者桥接日本晴序列空缺的克隆。通过实验验证,得到了可以覆盖7个日本晴序列空缺的BAC克隆资源,这将为日本晴序列空缺的闭合提供宝贵信息和资源。我们将93-11物理图谱与93-11和日本晴参考序列分别进行比对发现,比对结果中存在很多在93-11和日本晴参考序列染色体定位上不一致的克隆重叠群。对部分不一致克隆重叠群中的克隆进行FISH(Fluorescence In Situ Hybridization)分析发现,这些不一致的区域是由93-11基因组序列中的组装错误所导致。综上所述,水稻粳稻和籼稻代表品种日本晴和93-11的基因组测序虽然早已完成,但序列的完善工作仍然任重而道远。本研究提出了一种新的用于检测与纠正序列中组装错误的方法,而该方法也可用于提高其它基因组序列的质量。通过比对分析,本研究构建了闭合日本晴序列空缺的相关资源,并验证了部分93-11基因组序列中存在的错误。