论文部分内容阅读
马铃薯(Solanum tuberosum L.)在许多国家都是一种重要的主粮和经济作物。中国是世界马铃薯第一种植大国和生产大国,在世界马铃薯产业中起到了主导地位。为了解马铃薯种质资源的遗传多样性和群体结构,丰富目前匮乏的马铃薯基因以促进马铃薯改良,为了筛选与马铃薯块茎重要表型性状相关的SNPs位点及候选基因,同时为寻找与马铃薯生产上的主要病害之一马铃薯晚疫病抗性相关的候选基因,为马铃薯种质资源的创新利用和新品种选育提供参考依据。本研究通过简单重复序列(SSR)标记、扩增片段长度多态性(AFLP)标记技术和基于SLAF-seq技术开发出单核苷酸多态性(SNP)位点,对收集和保存的包括从世界上8个国家和国际马铃薯研究中心(CIP)及国内不同地方的288份马铃薯种质资源进行了系统的遗传多样性和群体结构研究;对4个主要块茎性状(芽眼色、芽眼深浅、肉色和皮色)进行了全基因组关联分析;进行了基于SNP标记的马铃薯种质资源抗晚疫病基因区域选择消除分析。本研究取得的主要结果如下:1.通过SSR和AFLP标记技术来评估这288份马铃薯种质资源的遗传多样性和群体结构,从20对表现多态性的SSR标记中检测到190个等位基因位点,从10个AFLP引物组合中共检测到983个多态性AFLP片段,通过叶贝斯分析法,将这些马铃薯资源分成了 7个亚群(SG)和1个混合群。通过叶贝斯分析法,聚类分析和主成分分析结果一致。对不同地区马铃薯种质资源群体间聚类分析,结果发现,南方群体与其它4个地区群体Nei’s遗传距离都比较远,与东北克山群体的距离最远,CIP群体与另外3个地区群体(北方、东北克山、国外群体)也比较远,东北克山群体与北方群体遗传距离最近。2.首次基于SLAF-seq技术开发出多态性SNP位点,将开发得到的280,124个遍布于整个基因组的群体多态性SNP,对马铃薯种质资源自然群体进行系统的遗传多样性和群体结构研究,根据进化树图,除去仅有1~4份资源的大分支,剩余的资源集中在4个亚群,除了亚群4基本都是CIP资源外,其它3个亚群上不同来源的马铃薯种质资源均有分布;由群体结构分析结果可知,根据交叉验证错误率的估值确定最优分群数为17,但是大部分亚群所包含的资源数都比较少(少于20份资源),大部分资源集中在群4、10、11、14和17五个亚群上;PCA分析结果与群体结构分析结果相一致,进化树分析和群体结构分析均发现马铃薯资源地域间差异不明显。3.综合比较3种标记的遗传多样性分析结果,3种标记的检测效率为:SNP标记>AFLP标记>SSR标记。4.用开发出的280,124个多态性SNP标记数据以及一般线性模型(GLM)和混合线性模型(MLM),对本单位收集保存的142份马铃薯种质资源4个主要块茎性状(芽眼色、芽眼深浅、肉色和皮色)进行关联分析,取关联的SNP位点选取前后10 kb的基因作为候选基因,通过COG数据库、GO数据库、KEGG数据库、Swiss-prot数据库和NR数据库进行基因注释。基于0.01显著水平,在GLM模式下,检测到8个标记位点与马铃薯资源芽眼色性状相关,分别分布于第1、2、6、10号染色体上,在3个SNPs附近共找到6个已知的功能基因;共检测到15个标记位点与马铃薯资源芽眼深浅性状相关,分别分布于第2、3、9、11和12号染色体上。在MLM模式下,在第2号染色体上也检测到1个与马铃薯资源芽眼深浅性状相关的标记位点,与GLM模式下检测到的第2号染色体上的标记位置一致,在6个SNPs附近共找到9个已知的功能基因;检测到11个标记位点与马铃薯资源肉色性状相关,分别分布于第1、2、3、5、7号染色体上,在6个SNPs附近找到10个已知的功能基因;在第1号染色体上检测到1个标记与皮色性状相关,在该SNP附近找到2个已知的功能基因。本研究分析找到的候选基因的信息为进一步研究基因功能奠定了基础。5.用280,124个多态性SNP标记数据,通过对所测142份马铃薯种质资源中对晚疫病表现抗病的40份资源组成的抗病群体和表现感病的75份资源组成的感病群体进行选择消除分析,对抗病群体受选择的清除位点区域基因进行GO数据库、COG数据库、KEGG数据库和植物R基因数据库注释。对GO注释到的602个基因进行功能分类,得到抗病群体受选择的清除位点区域基因在细胞组分、分子功能和生物学过程中的分布、数目及比例,细胞组分中基因最多的条目分别有506、500和419个基因,找到差异基因的比例较高的分别为3.5%、3.8%、4.1%和10%;在分子功能分类中,包含基因最多的条目分别拥有317和297个基因,找到差异基因的比例较高的分别为3.5%、3.1%、3.3%、3.6%和7.1%;生物学过程分类中基因最多的条目分别有478、451和435个基因,找到差异基因的比例最高的分别为6.0%和4.5%。对COG注释到的196个基因进行功能分类,发现在这些相关基因中,主要在“仅通用功能预测”、“转录”、“信号转导机制”和“复制重组和修复”有关的COG分类中得到显著富集;通过KEGG注释被注释进去基因最多的7个通路分别为:“植物激素信号转导”、“核糖体”、“内质网蛋白加工”、“剪接体”、“泛素介导的蛋白水解作用”、“RNA降解”和“RNA转运”通路,富集水平最显著且富集显著性最可靠的两个通路分别为“黄酮和黄酮醇生物合成”和“RNA降解”通路;通过植物R基因数据库注释,发现19个基因序列被注释的结果为马铃薯中的R基因,其中CNL型1个,RLP型2个,L型16个,具体的候选基因为马铃薯中的11个R基因,该11个R基因将做为后续研究中重点进行验证的基因。