论文部分内容阅读
小麦条锈菌(Puccinia striiformis f.sp.tritici,Pst)是一种重要的小麦病原真菌,由其引起的小麦条锈病严重影响到小麦粮食产量。国内外研究表明,病原菌毒性变异是导致小麦品种抗病性“丧失”,病害大规模流行的根本原因。锈菌毒性变异的根源是遗传物质的变异,全基因组测序分析是揭示锈菌类真菌演化规律和毒性变异分子机制的有效途径。本论文综合利用三代测序和二代测序各自优势,对完成的小麦条锈菌CY32全基因组草图进行了全新拼接优化,并对部分重测序显示突变的预测分泌蛋白基因进行了表达分析。主要包括四方面的研究:1.利用Pacific Biosciences(PacBio)第三代测序技术对小麦条锈菌全基因组进行组装,结合二代数据对基因组进行单碱基的插入和缺失纠错和补洞,并对基因组进行重新注释,最终得到优化更新的全新的CY32基因组草图。使用Pacbio测序平台构建20Kb SMRTbell文库,经过质控后共产生7.44G(Raw data)原始数据,序列覆盖度达到61.97×,经过滤和纠正之后得到3.5G(Correct data)正确数据,序列覆盖度达到30×。使用Illumina测序平台构建200bp、300bp、500bp、700bp、2K和6K文库,经质控后共产生29.55G的原始数据,序列覆盖度达到246.08×。使用30×Pacbio数据构建Contig,结合246.08×Illumina数据构建scaffold,最后使用Illumina-Pacbio数据进行纠正和补洞。组装统计显示:ContigN50为390,736bp,ScaffoldN50为532,961bp,GC含量为44.37%。Scaffold数量由原来的4,283减少到1,191,减少了3.6倍;ContigN50由原来的18,007bp提高到390,736,提升了21.7倍;ScaffoldN50由原来的125,324bp提高到532,961,提升了4.3倍;Gap碱基数量由原来的15,119,423bp减少到83,089bp,减少了182倍。经过组装升级之后,CY32基因组质量得到大大提升,作为标准基因组将为接下来大规模的重测序变异分析奠定坚实的基础。2.使用Illumina-Pacbio数据组装得到CY32基因组大小为120,898,252bp。使用Repeatmasker、TRF软件预测重复序列和转座子含量占基因组的43.5%。通过参考已发表的小麦秆锈菌、小麦条锈菌PST-78、落叶松-杨栅锈菌以及Broad上提交的小麦叶锈菌基因组序列,使用Genemarkes、SNAP、Augustus、Homology、Glean等软件对基因组进行注释,最终预测了22,287个基因。使用(Signalp、Targetp、Tmhmm、PredGPI)软件预测了2100个假定的分泌蛋白基因,其中条锈菌种特异的分泌蛋白基因499个;使用COG数据库进行功能注释发现参与基因复制、重组、修复等与遗传信息过程相关的基因数量为1761个,明显多于参与其他生物学过程的基因数量。这与小麦条锈菌毒性快速变异特征相吻合,解析这些基因的功能以及明确这些基因在不同小麦条锈菌之间的变异机制,可以让我们更好地理解小麦条锈菌基因组变异与毒性变异的关系。3.重测序预测的具有多态性位点的基因验证。前期完成的3个世界范围重要流行菌系(CY23、PK-CDRD、PST-78)重测序结果中包含了大量的单核苷多态性(single nucleotide polymorphisms,SNP)、短序列插入与缺失(short insertion and deletions,InDel)等变异,选取15个预测分泌蛋白基因,进行全长克隆和测序分析,发现其中5个基因存在显著地多态性位点。1)striiformis_Gene4629中由于单核苷酸多态性(SNP)变异造成5个氨基酸的替换;2)striiformis_Gene16278中由于重复序列转座子的影响造成编码氨基酸小片段的插入与缺失变异(InDel);3)striiformis_Gene2933中由于单核苷酸多态性(SNP)变异造成7个氨基酸的替换;4)striiformis_Gene28648中由于重复序列转座子的影响造成第279至331位氨基酸小片段的插入与缺失变异(InDel);5)striiformis_Gene23763中由于单核苷酸多态性(SNP)变异造成9个氨基酸的替换。4.预测分泌蛋白基因表达分析。选取20个预测分泌蛋白基因,通过qRT-PCR分析这些基因在条锈菌侵染小麦的不同时期的表达特征,共得到了14个基因在不同侵染时期的表达模式。结果表明:1)striiformis_Gene4096,striiformis_Gene6071,striiformis_Gene23763在夏孢子中基因表达量较高,表明这些基因可能在孢子形成及萌发过程起到重要作用。2)striiformis_Gene4096在整个侵染过程中都处于一个较高的表达水平,该基因具有DnaJ保守结构域,该结构域有热激蛋白(heat shock protein 40,HSP40)结合位点。DnaJ/HSP40蛋白复合体高度保守,在蛋白质翻译过程中的折叠、组装、转位和降解过程起到重要作用,它还可以激活HSP70,而HSP70是重要的分子伴侣。3)striiformis_Gene28555,striiformis_Gene6785,striiformis_Gene12678,striiformis_Gene28338在侵染后期表达量上升,并维持较高的表达水平,表明这些基因可能参与侵染后期菌丝的扩展过程。4)striiformis_Gene4112,striiformis_Gene4629,striiformis_Gene29175,striiformis_Gene1506,striiformis_Gene2933在各时期都有相对较低的表达量。