论文部分内容阅读
分离体混合分析(bulked segregant analysis,BSA)结合新一代测序(next-generation sequencing,NGS)技术,简称BSA-Seq,已被证明是一种简捷、高效且极具成本优势的单基因快速定位方法,并对数量性状基因座(quantitative trait locus,QTL)的快速定位也显得十分有效。近年来,关于应用BSA-Seq进行QTL定位的报道越来越多,正日渐成为QTL定位的主流方法。BSA-Seq在定位单个主基因时,可以直接定位目标基因,一般不需要进行统计显著性测验。但是在定位QTL时,由于试验中涉及的QTL数量未知,而且试验误差也会造成干扰,因此,显著性测验在QTL定位中是必不可少的。一般而言,在两个混合池之间表现出显著的等位频率差异的基因组区域才比较可能含有QTL。一个完整的QTL定位方法应该包括对QTL位置的点估计和置信区间估计,以及对QTL效应和遗传率(某个QTL解释的表型方差比例)的估计。在BSA-Seq中,由于试验能够提供的信息比较有限,因而对QTL效应和遗传率的估计很困难,目前还没有有关的方法学研究报道。在目前所有已提出的BSA-Seq统计分析方法中,几乎都只是集中在QTL位置的点估计上;对置信区间的估计也不够完善。本文提出一个新的基于BSA-Seq的QTL定位统计框架,称为“区块回归定位”(block regression mapping),简称 BReM。BReM 为基于 BSA-Seq 的 QTL定位提供了一个完整的解决方案,可以同时实现对QTL的位置、置信区间、效应方向和遗传率的估计。根据遗传率估计的模型和计算方法,对一些与BSA-Seq相关的影响因素(包括遗传率、选择率、等位频率差、群体类型、群体大小、QTL偏分离程度等)进行了分析。总的来讲,基于遗传率估计模型得出的推论与QTL定位的经验是相符的。通过对这些影响因素的分析,为BSA-Seq试验设计提供了理论依据和参考。为了检验BReM的可行性和有效性,用BReM对两套已发表的BSA-Seq试验数据(分别来自酵母和水稻)进行了分析。酵母试验调查的性状是高浓度酒精耐受性(high ethanol tolerance,HET),作图群体是单倍体群体,采用非对称混合池设计,即一个极端表型选择池(耐酒精)和一个随机非选择池。用BReM定位了 4个QTL,分别命名为qHET7、qHET13、qHET15a和qHET15b,它们两个水平的置信区间平均宽度分别为46.5 kb和53.75 kb,遗传率在18.41%至30.93%之间。其中,3个QTL的抗性基因来自强耐受亲本Seg5,共解释62.08%的表型变异;1个QTL抗性基因来自弱耐受亲本BY710,解释30.93%的表型变异。对4个QTL的候选基因进行了鉴定,最可能的分别是TFC4、COG8、IRA2和SHE4,其中IRA2已被报道与酒精抗性相关,参与酒精胁迫的代谢过程。水稻试验调查的性状是苗期耐寒性(cold tolerance at the seedling stage,简称CTSS),作图群体为10800个F3单株,采用对称混合池的试验设计,分别构建了极耐寒和极感寒的DNA混合池。用BReM定位了 6个QTL,分别命名为qCTSS1、qCTSS2a、qCTSS2b、qCTSS5、qCTSS8 和 qCTSS10。它们两个水平的置信区间平均宽度分别为2.09 Mb和2.82 Mb。其中4个QTL的抗性基因来自耐寒亲本Nipponbare,共解释18.93%的表型变异;另2个QTL的抗性基因来自感寒亲本LPBG,共解释9.69%的表型变异。这两个实际例子证明了 BReM的可行性和有效性。