论文部分内容阅读
檫木属(Sassafras)隶属于樟科(Lauraceae)樟亚科(Lauroideae Kosterm.),仅包括檫木(Sassafras tzumu)、台湾檫木(S.randaiense)和北美檫木(S.albidum)等3个种,是一个典型的东亚-北美间断分布属,其在樟科内部的系统发育地位一直存在争议。檫木为我国特有种,分布于中东部及南部地区。开展檫木种群遗传结构研究,解析檫木种群分化模式,有助于为解决檫木属系统分类争议提供更多种及种以下水平的分子性状证据。本研究基于Illumina Hi Seq TM2500测序平台的浅层次基因组双末端测序结果(2 x 150 bp),对檫木属13个个体(3个檫木个体和10个北美檫木个体)进行叶绿体全基因组的组装和基因注释,并通过比较基因组学方法开发了叶绿体高突变片段和叶绿体微卫星。剔除基因组数据中的叶绿体基因和线粒体基因后,完成对檫木核微卫星的开发,并基于核微卫星标记对檫木21个种群进行种群遗传学研究。本研究的主要结论如下:(1)基于二代高通量测序结果,本研究成功组装了檫木属2个种13个个体的叶绿体全基因组,其中檫木3个个体的叶绿体基因组全长分别为:151,795 bp(ZHS)、153,137 bp(BYS)、151,797 bp(HNS),而北美檫木叶绿体基因组全长范围在152,540bp(B20)-154,001 bp(B22)之间,序列长度表现出明显的个体间差异,檫木差异较小(2-1342 bp),北美檫木个体间差异较大(3-1461 bp)。所有个体叶绿体基因组均为四分体结构:2个方向相反的重复区、1个大单拷贝区和1个小单拷贝区,与樟科其他物种(除无根藤属Cassytha外)叶绿体基因组结构相同。进行基因注释后,所有个体叶绿体全基因组均包括111个基因,其中包含96个独有基因和15个重复基因。(2)对檫木属2个种共13个个体的叶绿体基因序列进行基因比对和高突变片段的搜寻,最终获得124个存在核苷酸变异的片段,其中50个位于基因编码区(平均值0.00147)、20个位于基因内含子中(平均值0.00220)、54个位于基因间隔区(基因间隔区0.00459),所有基因片段的平均核苷酸变异值为0.00295,整体变异较低,其中包括7个高突变片段(核苷酸变异值Pi>0.00600):Intron ndh A、trn H-psb A、psb A-trn K、pet A-psb J、rps18-rpl20、ccs A-ndh D、rps15-ycf1,其中pet A-psb J片段的Pi值为所有片段中的最高值(Pi=0.03421),而基于叶绿体基因组结构划分,94个高突变片段位于大单拷贝区(平均核苷酸变异值为0.00280),18个位于小单拷贝区(平均值0.00461),12个位于2个反向重复区(平均值0.00158)。在在线软件MISA中共获得60个同源的完美型檫木微卫星位点,而北美檫木中仅获得40个;对檫木属2个种13个个体进行同源位点筛选后得到34个同源位点,其中21个位于基因间隔区(62%)、6个位于基因内含子(17%%)、6个位于蛋白质编码区(18%),以及1个位于基因片段ycf1(3%)中,这些位点均可用于属内通用微卫星引物的设计。(3)将筛选的核微卫星位点在檫木21个种群中进行PCR扩增,对其扩增产物的分型结果进行遗传多样性和遗传结构的分析。檫木的平均等位基因数为5.522,平均等位基因丰富度为1.799,平均期望杂合度为0.326,观测杂合度平均值为0.349,遗传多样性各参数总体较低。其中云南乐利(LL)种群各指数均处于最低值(AR=1.593,HO=0.180,HE=0.228),湖南白云山(BYS)种群的等位基因丰富度AR=2.026和期望杂合度HE=0.404为最高值,山东垛山(DS)种群的观测杂合度最高(HO=0.443)。此外,云南乐利(LL)、江苏宜兴(YX)、贵州宽阔水(KKS)、广东黄牛石(HNS)、广西金钟山(JZS)、重庆金佛山(JFS)和湖南白云山(BYS)7个种群的观测杂合度均低于期望杂合度,且近交系数均为正值,存在杂合子缺失的情况,种群内部近交较为严重,主要由于其分布区周围均有高大山脉,可能对种群间基因交流产生阻隔。(4)通过Structure聚类分析,檫木21个种群被分为2个谱系:1)主要分布于我国东南部和长江以北的谱系1:广东黄牛石(HNS)、广东南岭(NL)、江西南风面(NFM)、福建南坊(NF)、福建君子峰(JZF)、福建武夷山(WYS)、浙江百山祖(BSZ)、安徽牯牛降(GNJ)、江苏宜兴(YX)、河南鸡公山(JGS)、湖北堵河源(DHY)、山东招虎山(ZHS)和山东垛山(DS)共13个种群;2)主要分布在中国西南部的谱系2:广西金钟山(JZS)、贵州雷公山(LGS)、贵州宽阔水(KKS)、云南乐利(LL)、湖南白云山(BYS)、湖南乌云界(WYJ)、重庆金佛山(JFS)和湖北后河(HH)共8个种群,地理隔离效应(IBD)的分析结果显示檫木种群的基因谱系空间分布格局与地理距离存在极显著相关性(r=0.372,P=0.010),因此谱系1和谱系2的分化与大巴山脉-庐山-衡山-雪峰山的地理界限有关。PCo A的结果也支持谱系1和谱系2的划分,谱系1的种群除广东黄牛石外均聚在一起,而谱系2的种群不存在明显的聚集情况。此外,基于NJ和UPGMA的系统发育结果,谱系2均位于基部类群,而谱系1的种群往往聚为一个大枝,因此谱系2可视为檫木中较为原始的类群。综上所述,可将檫木21个种群划分为2个显著进化单元(ESU,Evolutionarily significant unit),谱系1即为ESU1,谱系2组成ESU2,ESU2的种群在檫木种群的系统发育树中均位于基部类群,较为原始,且在Pco A分析中无明显的聚集情况。此外,ESU2的大多数种群表现为内部近交严重,且檫木种群总体遗传多样性和总体基因流均较低,对环境的潜在适应能力缺乏优势,故可将更为原始且种群间基因交流相对更少的ESU2的种群作为改善檫木环境适应性的重点,进行远距离个体杂交和生境保护,防止檫木种群内部基因劣化。