小麦条锈菌CY32基因组草图优化更新及预测分泌蛋白基因表达分析

来源 :河南农业大学 | 被引量 : 0次 | 上传用户:dorothyhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小麦条锈菌(Puccinia striiformis f.sp.tritici,Pst)是一种重要的小麦病原真菌,由其引起的小麦条锈病严重影响到小麦粮食产量。国内外研究表明,病原菌毒性变异是导致小麦品种抗病性“丧失”,病害大规模流行的根本原因。锈菌毒性变异的根源是遗传物质的变异,全基因组测序分析是揭示锈菌类真菌演化规律和毒性变异分子机制的有效途径。本论文综合利用三代测序和二代测序各自优势,对完成的小麦条锈菌CY32全基因组草图进行了全新拼接优化,并对部分重测序显示突变的预测分泌蛋白基因进行了表达分析。主要包括四方面的研究:1.利用Pacific Biosciences(PacBio)第三代测序技术对小麦条锈菌全基因组进行组装,结合二代数据对基因组进行单碱基的插入和缺失纠错和补洞,并对基因组进行重新注释,最终得到优化更新的全新的CY32基因组草图。使用Pacbio测序平台构建20Kb SMRTbell文库,经过质控后共产生7.44G(Raw data)原始数据,序列覆盖度达到61.97×,经过滤和纠正之后得到3.5G(Correct data)正确数据,序列覆盖度达到30×。使用Illumina测序平台构建200bp、300bp、500bp、700bp、2K和6K文库,经质控后共产生29.55G的原始数据,序列覆盖度达到246.08×。使用30×Pacbio数据构建Contig,结合246.08×Illumina数据构建scaffold,最后使用Illumina-Pacbio数据进行纠正和补洞。组装统计显示:ContigN50为390,736bp,ScaffoldN50为532,961bp,GC含量为44.37%。Scaffold数量由原来的4,283减少到1,191,减少了3.6倍;ContigN50由原来的18,007bp提高到390,736,提升了21.7倍;ScaffoldN50由原来的125,324bp提高到532,961,提升了4.3倍;Gap碱基数量由原来的15,119,423bp减少到83,089bp,减少了182倍。经过组装升级之后,CY32基因组质量得到大大提升,作为标准基因组将为接下来大规模的重测序变异分析奠定坚实的基础。2.使用Illumina-Pacbio数据组装得到CY32基因组大小为120,898,252bp。使用Repeatmasker、TRF软件预测重复序列和转座子含量占基因组的43.5%。通过参考已发表的小麦秆锈菌、小麦条锈菌PST-78、落叶松-杨栅锈菌以及Broad上提交的小麦叶锈菌基因组序列,使用Genemarkes、SNAP、Augustus、Homology、Glean等软件对基因组进行注释,最终预测了22,287个基因。使用(Signalp、Targetp、Tmhmm、PredGPI)软件预测了2100个假定的分泌蛋白基因,其中条锈菌种特异的分泌蛋白基因499个;使用COG数据库进行功能注释发现参与基因复制、重组、修复等与遗传信息过程相关的基因数量为1761个,明显多于参与其他生物学过程的基因数量。这与小麦条锈菌毒性快速变异特征相吻合,解析这些基因的功能以及明确这些基因在不同小麦条锈菌之间的变异机制,可以让我们更好地理解小麦条锈菌基因组变异与毒性变异的关系。3.重测序预测的具有多态性位点的基因验证。前期完成的3个世界范围重要流行菌系(CY23、PK-CDRD、PST-78)重测序结果中包含了大量的单核苷多态性(single nucleotide polymorphisms,SNP)、短序列插入与缺失(short insertion and deletions,InDel)等变异,选取15个预测分泌蛋白基因,进行全长克隆和测序分析,发现其中5个基因存在显著地多态性位点。1)striiformis_Gene4629中由于单核苷酸多态性(SNP)变异造成5个氨基酸的替换;2)striiformis_Gene16278中由于重复序列转座子的影响造成编码氨基酸小片段的插入与缺失变异(InDel);3)striiformis_Gene2933中由于单核苷酸多态性(SNP)变异造成7个氨基酸的替换;4)striiformis_Gene28648中由于重复序列转座子的影响造成第279至331位氨基酸小片段的插入与缺失变异(InDel);5)striiformis_Gene23763中由于单核苷酸多态性(SNP)变异造成9个氨基酸的替换。4.预测分泌蛋白基因表达分析。选取20个预测分泌蛋白基因,通过qRT-PCR分析这些基因在条锈菌侵染小麦的不同时期的表达特征,共得到了14个基因在不同侵染时期的表达模式。结果表明:1)striiformis_Gene4096,striiformis_Gene6071,striiformis_Gene23763在夏孢子中基因表达量较高,表明这些基因可能在孢子形成及萌发过程起到重要作用。2)striiformis_Gene4096在整个侵染过程中都处于一个较高的表达水平,该基因具有DnaJ保守结构域,该结构域有热激蛋白(heat shock protein 40,HSP40)结合位点。DnaJ/HSP40蛋白复合体高度保守,在蛋白质翻译过程中的折叠、组装、转位和降解过程起到重要作用,它还可以激活HSP70,而HSP70是重要的分子伴侣。3)striiformis_Gene28555,striiformis_Gene6785,striiformis_Gene12678,striiformis_Gene28338在侵染后期表达量上升,并维持较高的表达水平,表明这些基因可能参与侵染后期菌丝的扩展过程。4)striiformis_Gene4112,striiformis_Gene4629,striiformis_Gene29175,striiformis_Gene1506,striiformis_Gene2933在各时期都有相对较低的表达量。
其他文献
随着大数据时代的到来,信息过载问题日益突出。如何从大量的非结构化的数据中找到对自己有用的信息成了急需解决的问题,在这种情况下,推荐系统应运而生。本文主要介绍了关于topN推荐的协同过滤算法和基于图模型的算法,针对本文用到的学生刷卡数据集,进行了符合实际的算法的改进。本文提出了两种新的描述商品在推荐列表中的位置的评价指标。针对协同过滤算法,我们提出了一种计算相似度时减少算法复杂度的算法。针对图模型算
作为全球的重大挑战之一,癌症和基因疾病正严重危害人类的生命和健康。前人研究表明,金属元素可以通过与脱氧核糖核酸(DNA)碱基鸟嘌呤结合,打开鸟嘌呤和胞嘧啶间氢键,或者选
近年来,手势交互受到越来越多的关注。同时,随着深度摄像头(如Kinect,Real Sense)的应用和人体姿态估计算法的发展,我们可以从图片或视频中获取人体的关键点坐标。虽然基于关
在计算机视觉的研究中,图像去模糊是一个广受关注但难度较大的问题。一幅模糊图像的形成,原因是多种多样的:相机抖动、物体运动、相机失焦等等,这也使得去糊工作因为需要考虑多方面因素而显得复杂。图像去模糊根据模糊过程中的模糊核是否已知,主要分为非盲去模糊和盲去模糊两种类型。而本文主要研究的盲去模糊则是去模糊工作中已知信息较少,难度也较高的一类工作。在盲去模糊的过程当中,模糊核与清晰图像的先验工作是相当重要
我国西南地区锌矿资源丰富,这些资源中有大量的低品位硫氧混合锌矿,其特点是:锌品位低,闪锌矿和氧化锌矿共生,结构复杂,碱性脉石成分和SiO_2含量高,因而不宜采用酸性浸出;虽然采用氨浸法可以避免碱性脉石和SiO_2的溶出,有利于减少试剂消耗,能够处理这类复杂锌矿,但采用氨浸法不能溶出硫氧混合锌矿中难溶的闪锌矿或铁闪锌矿,致使锌的浸出率降低。针对氨浸法存在的不足,并根据硫氧混合锌矿中CaCO_3含量较
近红外二区(NIR-Ⅱ,1000-1700 nm)荧光生物成像与常用的可见光(400-700nm)与近红外一区(NIR-I,700-1000 nm)相比,具有组织穿透能力更深和信噪比更高等优势,近年来得到了广泛的关注
近年来人工智能的迅速发展为计算机技术注入了新的生机与活力,深度学习凭借其优异的性能,已被广泛应用在多个领域,其中不乏安全敏感型领域,如自动驾驶。因此深度学习的安全性
大丽轮枝菌(Verticillium dahliae)引起的棉花黄萎病是一种土壤传播的维管束病害,是生产上最重要的病害之一。由于缺乏好的抗源材料与防治药剂,棉花黄萎病防治较为困难。微菌核
强化学习是机器学习重要研究领域之一,是实现智能体自动适应环境的主要工具,并在复杂任务中显示出巨大潜力。但是当前强化学习技术需要大量的交互数据,在现实应用中需要高昂
近些年以来,无线电能传输技术的发展十分迅猛。然而,该技术还处于起步阶段,许多理论和实验研究还比较欠缺,相关模型的研究还不够完善。本文从印刷螺旋线圈(printed spiral coils,PSCs)的设计出发,建立了一套完整的设计体系,从系统的建模、性能优化、电路仿真以及实验的验证等方面证明了基于印刷螺旋线圈的无线电能传输系统的可行性。作为无线电能传输系统的重要组成部分,接收与发射线圈是无线电能