论文部分内容阅读
全基因组关联分析(genome-wide association study, GWAS)已经被广泛应用于研究复杂性状的遗传变异。目前在作物中定位到大量与经济性状和农艺性状相关的SNP位点,但由于SNP间存在的较高连锁不平衡(LD)导致很难高效地筛选出与目标性状相关的候选基因。利用单倍型进行关联分析,考虑到SNP间的LD信息,可以进一步缩小定位范围,从而更加可靠地挖掘出与目标性状相关的候选基因。本研究利用419份陆地棉核心种质At和Dt基因组上的2,598,183个SNP进行全基因组单倍型关联分析,发现共有21,847个基因位于419份材料的CDS区。基于一般线性模型构建统计量,采用哑变量编码单倍型,利用似然比检验法进行统计检验,最终在CDS区共定位到9个与开花期相关的基因,分为位于Dt03和Dt08染色体上,其中Gh_D03G0728的基因功能已经得以验证(Ma et al. Nature Genetics 2018)。本研究表明,与基于SNP的关联分析相比,利用单倍型进行关联分析可以使挖掘到的候选基因准确性更高,为相关基因功能验证提供更加可靠的信息。