论文部分内容阅读
植物细菌病害每年都对全世界农业造成巨大的损失。从分子水平上对植物致病菌的研究已经取得了极大的进展,这有助于我们更深入的了解植物致病菌。截止到2007年底,已有16个植物致病菌被测序完成。然而,虽然我们已经有大量的实验室数据注释植物致病菌的基因组,但是在国际公共数据库中已有的基因组注释信息依然存在很多问题。针对这些问题,我们构建了一个对植物致病菌基因组重新注释的数据库DIGAP。DIGAP数据库有如下特征:(1)植物致病菌基因组的假定功能基因被重新识别。运用Z-curve曲线方法从假定功能基因中识别出一些非编码开放阅读框(ORF),同时我们还通过主成分分析(PCA)、序列平均长度比较和直系同源蛋白聚类(COG)分析等方法证明了这些非编码序列与功能基因的不同。(2)所有蛋白编码基因的翻译起始位点被重新确认。根据NCBI原有的翻译起始位点数据,结合北京大学2008年构建的重新确认微生物翻译起始位点的数据库ProTISA的资源,和翻译起始位点识别软件GS-finder的识别结果,运用陪审团算法得到植物致病菌最终的翻译起始位点。(3)大量的植物致病菌假定功能基因通过序列比对方法被重新注释功能。(4)两种理论的基因表达水平计算方法CAI和E(g)预测了植物致病菌基因组的基因表达水平。(5)与人类的抗菌药物靶标同源的植物致病菌潜在抗菌药物靶标都被识别并在数据库中一一列举。同时,还通过同源模建和分子动力学模拟方法模建了潜在靶标的3D结构。总之,DIGAP数据库提供的更为精确的植物致病菌基因组信息对植物致病菌的下一步研究和新的抗菌杀菌剂的发现具有重大的参考和研究价值。构建在LAMP平台上的DIGAP数据库的所有信息都可以从DIGAP数据库网站免费获得。网址:http://sdbi.sdut.edu.cn/digap/。