论文部分内容阅读
甘蓝型油菜(Brassica napus L.)是我国乃至世界上重要的油料作物。解析其复杂数量性状的遗传机理,是油菜遗传改良工作中的一项重要研究内容。在油菜传统数量性状遗传解析中,人们常用双亲本杂交作图群体进行连锁分析或用自然群体进行全基因组关联分析,但连锁分析与关联分析方法都有其固有的局限性。巢式关联作图(Nested association mapping,NAM)群体是由多亲本杂交、多代连续自交构建的多家系重组自交系群体组成的复合群体。NAM群体充分利用了多亲本积累的历史重组事件和杂交自交过程中发生的重组事件,利用NAM群体可以进行连锁分析与关联分析,具有等位基因频率高、定位分辨率高与定位功效高等优势,已广泛应用于多种作物复杂数量遗传性状的遗传解析。本研究中,我们构建了油菜NAM(BN-NAM)群体,分析了其群体结构、LD水平等遗传特性,并解析了开花期性状的遗传基础。主要研究内容及结果如下:1.油菜巣式关联作图群体的遗传特性解析本研究以优良品种“中双11”(ZS11)为共同父本,分别与15个具有广泛代表性的春性和半冬性自交系杂交,从F1开始连续自交6代,通过单粒传法构建了15个重组自交系(Recombinant inbred lines,RIL)群体(NAM01-15),单个RIL群体包含117213个家系,总共有2,425个家系,这些RIL家系共同构成BN-NAM群体。我们首先用简化基因组测序(Reduced representation library sequencing)对BN-NAM的所有家系进行基因型分析,构建每个RIL群体的遗传连锁图(Linkage map,LM),单个遗传连锁图包含4,079至9,375个数量不等的SNP标记;单个遗传连锁图的总长度为1,564.7 cM(centiMorgans)2,446.2 cM,平均长度为1,989.7 cM;将共分离的SNP标记合并成一个bin区块后,单个LM包含的bin数目为1,308个(NAM11)到2,805个(NAM15)之间,平均包含1,834个bin。随后,我们将15个遗传连锁图整合,构建了整个BN-NAM群体的联合连锁图谱(Joint linkage map,JLM),共包含30,209个非冗余SNP标记和10,182个bin。最后,我们对16个亲本进行深度重测序,共鉴定出3,885,328个SNP和558,981个INDEL变异。利用每个LM上标记的物理位置,将重测序鉴定到的4,444,309个SNP或INDEL标记映射进后代家系中,建成了BN-NAM群体的全基因组变异图谱(Whole-genome variation map,WVM)。群体结构分析将BN-NAM群体被划分为3个群。在主成分分析中,由于受到共同父本ZS11的影响,BN-NAM群体的所有家系分布在3个不同方向,呈发散状围绕在ZS11周围,由此推断,BN-NAM群体存在微弱的群体结构,其不同RIL群体的家系之间既保持着一定的遗传距离,又具有一定的亲缘关系。通过统计BN-NAM群体所有家系的重组事件发现,单个RIL群体内发生的重组事件数目介于NAM14群体的4,109次到NAM07群体的8,603次之间。整个BN-NAM群体共发生了88,386次重组事件,平均每个家系发生了41.4次重组。随后我们以100Kb为滑动窗口,计算了染色体相同滑动区间内重组率(LRRs)与基因、转座子、SNP、INDEL的密度和连锁不平衡(Linkage disequilibrium,LD)的相关性。结果分析发现,染色体上LRRs的分布与基因(r=0.57,P=0)、SNP(r=0.32,P=1.25×10-150)及INDEL(r=0.52,P=0)的密度具有很强的正相关性,而与转座子(r=-0.28,P=6.17×10-115)密度及LD(r=-0.48,P=0)的分布具有很强的负相关性。BN-NAM群体在全基因组19条染色体上的LD衰减距离介于160Kb到2,400Kb之间,在染色体之间差别巨大,尤其在是在亚基因组A与C之间。其中,A基因组上10条染色体的平均衰减距离为280Kb,变异幅度从160Kb到450Kb;C基因组上9条染色体的平均衰减距离为940Kb,变异幅度从360Kb到2,400Kb。进一步分析发现,A基因组上的LD衰减距离远远小于C基因组,原因在于C基因组存在较多的高LD区块,尤其是在着丝粒区域。2.BN-NAM群体的开花期QTLs解析连续4年共8个环境(6个冬环境和2个春环境)种植BN-NAM群体,调查每个家系的开花期,并分别用连锁分析、联合连锁分析和全基因组关联分析(GWAS)方法对BN-NAM群体开花期进行了QTL分析。首先,利用每个RIL群体的遗传连锁图(LM)单独进行QTL分析,一共定位得到非冗余的42个QTLs,其中15个QTLs在多个RIL群体、多个环境中同时被检测到,有19个QTLs解释的表型变异超过10%。联合连锁分析在冬、春环境中分别定位到34与30个QTLs。另外,GWAS分析也分别在冬、春环境中定位到63和79个QTLs。通过将三种不同分析方法得到的QTLs进行合并,发现有13个JLM与66个GWAS显著性SNP可以合并到LM分析的QTLs置信区间内,表明三种分析方法中存在大量可重复性QTLs,特别是分布在A02、A10、C02和C08染色体上的一些主效QTLs。经过合并后,三种方法共鉴定出169个QTLs。为了进一步解析油菜的开花机理,参考拟南芥开花调控网络相关基因及ZS11参考基因组的序列信息,在QTLs候选区间内预测到125个调控开花期的候选基因,包含了多个拟南芥开花调控网络中的关键基因,如FLC、FT、VIN3、CRY2、FLD、AP1、CO和SOC1的同源基因。在24个显著关联的SNPs位点上下游50Kb的区间内鉴定到22个开花相关的候选基因,这些显著SNPs位点大多解释了较高的表型变异,且其中一部分位点的定位分辨率甚至达到了单基因水平。值得注意的是,A2、A10和C2染色体上的关联区间内存在控制春化途径重要基因FLC的三个同源拷贝(BnaA02.FLC、BnaA10.FLC和BnaC02.FLC)。BN-NAM群体在开花期QTL遗传解析中展现出较高的定位功效及分辨率。