论文部分内容阅读
摘要:本研究根据已公布的禾谷镰刀菌的全基因组信息,以其全基因组蛋白序列为试验材料,通过生物信息学方法,对其候选效应分子及其功能进行预测和分析。首先利用SignalP、TMHMM、Protcomp、big-PI Predictor、TargetP等程序依次预测出其分泌类型的蛋白,再通过其序列大小和半胱氨酸的含量作进一步筛选,最后利用Blastp工具与非冗余蛋白质数据库进行比对,找出数据库中没有蛋白同源性的序列,从而获得候选效应分子。最终对禾谷镰刀菌全基因组的14 038个蛋白序列进行分析,预测了126个符合条件的候选效应分子。本研究通过LTR-FINDER程序对禾谷镰刀菌全基因组内的转座子进行分析,但未发现转座子存在,值得进一步分析研究。本研究采用生物信息学分析方法预测出了禾谷镰刀菌的候选效应分子并查找其基因组内转座子情况,可为进一步研究这些效应分子的功能,了解禾谷镰刀菌进化奠定基础。
关键词:禾谷镰刀菌;全基因组;候选效应因子;转座子;生物信息学;致病机制;进化历程
禾谷镰刀菌(Fusarium graminearum)属半知菌类丛梗孢目瘤座孢科镰刀属菌。在粮食上普遍存在,它与其他几种镰刀菌都能引起小麦、大麦、玉米等作物发生赤霉病,还可以引起水稻、高粱、豆类、茭白等发生根腐病、茎基腐病、穗腐病。由镰刀菌引起的赤霉病不仅会造成粮食产量减产,而且产生的真菌毒素也给人畜的健康造成了严重威胁[1-4]。
病原菌在入侵植物的过程中会分泌效应分子到寄主植物细胞中,对寄主植物细胞的生理、生化过程及细胞代谢等产生显著的影响。通过这些致病效应因子的作用病原菌可以克服寄主植物的防卫反应,从而促进和完成对寄主植物的侵染[5]。效应分子由于要分泌到细胞外起作用,因此一般具有以下特征:(1)含有N端信号肽;(2)无跨膜结构域;(3)无糖基磷脂酰肌醇锚定位点;(4)没有将蛋白输送至线粒体或其他胞内细胞器的预测定位信号;(5)氨基酸残基数量大约为50~300个氨基酸;(6)富含半胱氨酸而且特异性高于其他病原菌的效应分子[6-7]。因此,可以根据效应因子的一般结构特征对已完成测序的病原微生物进行分析,预测其中可能的候选效应因子,目前已有多篇报道针对多种病原微生物的侯选效应因子进行生物信息学预测分析的报道[8-10]。转座子是一类能够在基因组中通过转录或逆转录,在内切酶的作用下,在其他基因座上出现的DNA序列。通过对转子的分析,有助于了解微生物的进化历程[11-12]。本研究于2017年8月对已有的禾谷镰刀菌测序数据进行统计归纳,分析其基因组中的候选效应因子序列及转座子序列,以期对了解禾谷镰刀菌的致病机制及进化历程有指导意义。
1 材料与方法
1.1 禾谷镰刀菌全基因组数据
禾谷镰刀菌全基因组数据来自数据库(http://www.broad-institute),该数据库还收录了该病菌预测的14 038条预测基因DNA序列及其预测蛋白质的氨基酸序列。
1.2 信号肽预测
SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)是预测信号肽的服务器。它的功能是预测给定的氨基酸序列中是否存在潜在的信号肽剪切位点及其所在置,原核生物和真核生物都可以进行预测。以SignalP 4.1分析给定的氨基酸序列C、S、Y的最大值,以及位于N端和被预测的剪切位点间S曲线的中间值,以此区分信号肽和非信号肽。而信号肽剪切位点则位于预测的含有信号肽蛋白的Y曲线的最大值处,本试验中使用默认设置[13]。
1.3 蛋白的跨膜结构域预测
TMHMM Server(http://www.cbs.dtu.dk/services/TMHMM/)主要用于预测蛋白的跨膜结构域[14]。
1.4 亚细胞定位预测
ProtComp(http://www.softberry.com/berry.phtml?topic=protcompan
关键词:禾谷镰刀菌;全基因组;候选效应因子;转座子;生物信息学;致病机制;进化历程
禾谷镰刀菌(Fusarium graminearum)属半知菌类丛梗孢目瘤座孢科镰刀属菌。在粮食上普遍存在,它与其他几种镰刀菌都能引起小麦、大麦、玉米等作物发生赤霉病,还可以引起水稻、高粱、豆类、茭白等发生根腐病、茎基腐病、穗腐病。由镰刀菌引起的赤霉病不仅会造成粮食产量减产,而且产生的真菌毒素也给人畜的健康造成了严重威胁[1-4]。
病原菌在入侵植物的过程中会分泌效应分子到寄主植物细胞中,对寄主植物细胞的生理、生化过程及细胞代谢等产生显著的影响。通过这些致病效应因子的作用病原菌可以克服寄主植物的防卫反应,从而促进和完成对寄主植物的侵染[5]。效应分子由于要分泌到细胞外起作用,因此一般具有以下特征:(1)含有N端信号肽;(2)无跨膜结构域;(3)无糖基磷脂酰肌醇锚定位点;(4)没有将蛋白输送至线粒体或其他胞内细胞器的预测定位信号;(5)氨基酸残基数量大约为50~300个氨基酸;(6)富含半胱氨酸而且特异性高于其他病原菌的效应分子[6-7]。因此,可以根据效应因子的一般结构特征对已完成测序的病原微生物进行分析,预测其中可能的候选效应因子,目前已有多篇报道针对多种病原微生物的侯选效应因子进行生物信息学预测分析的报道[8-10]。转座子是一类能够在基因组中通过转录或逆转录,在内切酶的作用下,在其他基因座上出现的DNA序列。通过对转子的分析,有助于了解微生物的进化历程[11-12]。本研究于2017年8月对已有的禾谷镰刀菌测序数据进行统计归纳,分析其基因组中的候选效应因子序列及转座子序列,以期对了解禾谷镰刀菌的致病机制及进化历程有指导意义。
1 材料与方法
1.1 禾谷镰刀菌全基因组数据
禾谷镰刀菌全基因组数据来自数据库(http://www.broad-institute),该数据库还收录了该病菌预测的14 038条预测基因DNA序列及其预测蛋白质的氨基酸序列。
1.2 信号肽预测
SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP/)是预测信号肽的服务器。它的功能是预测给定的氨基酸序列中是否存在潜在的信号肽剪切位点及其所在置,原核生物和真核生物都可以进行预测。以SignalP 4.1分析给定的氨基酸序列C、S、Y的最大值,以及位于N端和被预测的剪切位点间S曲线的中间值,以此区分信号肽和非信号肽。而信号肽剪切位点则位于预测的含有信号肽蛋白的Y曲线的最大值处,本试验中使用默认设置[13]。
1.3 蛋白的跨膜结构域预测
TMHMM Server(http://www.cbs.dtu.dk/services/TMHMM/)主要用于预测蛋白的跨膜结构域[14]。
1.4 亚细胞定位预测
ProtComp(http://www.softberry.com/berry.phtml?topic=protcompan