论文部分内容阅读
通过基因组选择(Genomic selection,GS)方法加速畜禽遗传改良是全球动物育种者的共识。近年来,高通量测序技术发展迅速,不断降低的测序成本使基因组序列数据(Whole genome sequencing,WGS)用于GS成为可能。基于WGS数据的GS是在传统基因组选择基础上的一个全新研究领域,具有明显的理论优势,即与性状相关的生物学先验知识均可与基因组序列建立映射关系,进而加入到基因组选择模型中,从而提高育种值或表型值的预测准确性,在育种领域具有广阔的应用前景。然而,目前全基因组测序成本仍相对较高,对畜禽群体全群实施全基因组测序仍难以实现。因此,如何利用基因型填充技术以较低成本获取高质量的WGS数据也成为一个亟待解决的关键问题。综上,本文开展了以下研究工作:1)利用筛选关键个体测序以及下载公共数据库重测序数据构建不同的基因型填充参考群,并探究不同策略对基因型填充准确性的影响;2)探究不同策略填充和修剪全基因组序列数据对基因组预测准确性的影响;3)探究全基因组序列数据、基于群体分化信息预选标记以及不同方法构建亲缘关系矩阵对合并群体GS预测准确性的影响;4)探究多组学数据辅助基因组特征标记预选对基因组选择的预测能力的影响。并获得以下研究结果:1)使用合并参考群的基因型填充准确性最高(0.982±0.003)、外部参考群的基因型填充准确性次之(0.920±0.007)、内部参考群的基因型填充准确性最低(0.834±0.012)。利用合并参考群进行基因型填充的最优策略应综合考虑:内部群体的遗传多样性、公共数据库测序个体的可用性、最小等位基因频率、内部参考群个体测序成本以及所需的计算机资源等因素。2)利用基因型填充获取WGS数据进行基因组预测,应考虑基因型填充参考群体与目标群体的亲缘关系,减少基因型填充的异质性,特别是使用外部参考群个体扩大参考群规模时。此外,利用全基因组关联分析(Genome wide association study,GWAS)结果和连锁不平衡(Linkage disequilibrium,LD)信息进行标记预选能够有效地提高基因组预测准确性。3)使用WGS数据、非线性亲缘关系矩阵或固定指数(Fixation index,)预选标记都能提高合并群体基因组选择的准确性。在约克夏猪合并群体中,基于80K芯片使用0.05<<0.15标准预选标记构建非线性亲缘关系矩阵进行基因组预测,母猪的产活仔数(Number of piglets born alive,NBA)和总产仔数(Total number of piglets born,TNB)性状的最高预测准确性分别为0.451和0.490,与直接使用80K芯片构建线性亲缘关系矩阵进行基因组选择的准确性相比,分别提高了15.94%和9.131%。4)多组学数据辅助基因组特征标记预选可以提高基因组预测的准确性。在雌(雄)性果蝇群体中,利用全转录本关联分析(Transcriptome-wide association studies,TWAS)的显著基因的表达数量性状基因座定位(Expression quantitative trait locus mapping,e QTL mapping)结果预选标记进行基因组预测,发现惊吓反应性状的基因组最佳线性无偏预测(Genomic best linear unbiased prediction,GBLUP)和基因组特征最佳线性无偏预测(Genomic feature best linear unbiased prediction,GFBLUP)的最高预测准确性分别为0.437±0.015(0.427±0.015)和0.419±0.016(0.390±0.014),相对比使用完整WGS的GBLUP准确性,分别提高了60.66%(39.09%)和54.04%(27.04%)。总的来说,该研究获得一套基于合并参考群的畜禽基因型填充优化方案,提出了多种预选基因组特征标记的新策略提高基因组选择的预测能力,为基于WGS数据的基因组选择的应用实施提供理论支持及参考依据。