论文部分内容阅读
在自然界中,生物体存在丰富的表型变异,很大程度是源于个体基因组巨大的多样性。因此,基因组变异的研究对我们探明个体表型差异的原因具有重要意义,一直以来都是备受关注的重大科学问题。大规模基因组变异鉴定,不仅能深入认识同一物种、不同个体基因组变异的特征和规律,而且能够为遗传图谱构建和基因定位提供高密度的分子标记。近十年来,基因组学的研究方法和技术呈现出跨越式的发展趋势。尤其是令人瞩目的高通量测序技术,使分子标记的探寻在密度和通量上都达到了前所未有的新高度,为实现全基因组基因分型提供了更加高效的途径,也为作物育种改良提供了强有力的支持。玉米是目前全世界第一大粮食作物,也是重要的能源作物,其种植范围最广、产量最高。不仅如此,玉米基因组所特有的高遗传多样性和结构复杂性,也使玉米成为遗传学和基因组学研究中的模式植物之一。本研究以玉米基因组为研究对象,以具有广泛遗传和基因组多样性的多亲本高世代互交系(Multi-parent Advanced Generation Inter-Cross,MAGIC)群体为研究材料,其中包含24个我国育种骨干亲本和1404个子代自交系。结合多种高通量基因型鉴定方式,包括全基因组重测序(Whole Genome Sequencing,WGS)、基于简化基因组的基因型分型技术(Genotyping By Sequencing,GBS)和高密度芯片等策略发掘序列多态性,以期获得一套高密度的玉米全基因组分子标记集,作为后续构建玉米遗传图谱以及研究遗传学和基因组学重要生物学问题的基础数据。此外,由于该群体所用亲本是被我国育种家广泛应用的骨干自交系,其与当前玉米参考基因组有很大不同,同时拥有诸多优良农艺性状,因此该群体特有的基因序列为育种改良提供了非常大的借鉴意义。于是我们分别在亲本和子代群体水平对该群体的特有序列进行了组装,进而开展玉米泛基因组的挖掘和分析工作。概括地讲,本研究利用丰富的数据资源,进行了系统的基因组变异分析,我的主要工作及结果包括以下3个部分:第一:对1428份MAGIC材料提取了用于测序的DNA,并协助构建、改进实验室GBS测序分析平台。完成MAGIC群体中279份玉米自交系材料的GBS文库构建、测序及基因型鉴定工作,最终共获得653,876个单核苷酸多态性(SNP)标记。第二:对群体子代1404份个体进行1倍深度、24个亲本11倍深度的全基因组重测序,采用改进的常规策略进行群体的单核苷酸多态性鉴定工作,经过缺失基因型填补和过滤最终共保留53.3 M个SNP位点。对其中258份材料进行了200 K SNP芯片的测序和基因型鉴定工作,共获得56423个高分辨率SNP位点。亲本材料的重测序、GBS与SNP芯片得到的基因型结果一致率分别达到了99%和98%左右,这在一定程度上说明了包括我们构建的GBS分析平台在内的SNP calling策略及后续分析流程、质量控制的可靠性。第三:采用从头组装策略,经过过滤分别得到了亲本材料367 M的特有序列和整个群体(子代和亲本)600 M的特异序列,并对组创出的重叠群(contig)进行了基本的特征、分布统计和初步的功能分析。