论文部分内容阅读
多功能酶(MFEs)是一类具有两种或两种以上功能的酶类,根据不同的机制,将多功能酶分为含有多个结构域的多功能酶(MCD-MFEs)和含有单个结构域的多功能酶(SMAD-MFEs)。多功能酶可以以多种形式有利于生物体的存活和进化。多功能酶能运用各种途径协调生物体内的多种生物活动,甚至能调节自身的表达。作为进化优势的一部分,多功能酶在不需要扩大基因组的前提下,提高生物体的资源利用效率。此外,MFEs通常参与多个细胞代谢网络,能在不同细胞通路和功能中快速切换功能,成为生化或信号通路的一个开关点,为生物对周边环境的变化做出快速的反应。分析、定性和预测多功能酶的将对于细胞过程串联的潜在分子机制的研究起重要的作用。在本研究中,针对两类不同的多功能酶(MCD-MFEs和SMAD-MFEs)分别构建和优化支持向量机(Support Vector Machines)学习模型。在模型的优化和训练中用到了3,120个来自于SWISS—PROT蛋白质数据库已知多功能酶(正数据),以及21,833个来源于Pfam数据库各个结构域蛋白家族的种子序列(负数据)。每一个蛋白序列的特征向量根据氨基酸残基的理化性质表按一定的计算方法得到,这些理化性质包括氨基酸组成,疏水性,规格化的范德华体积,极性,极化,电荷,表面张力,二级结构和溶剂残留量。三个理化特征描述符用于量化将蛋白质一级氨基酸序列,进而转化为代表蛋白质的特征向量。在此基础上,基于该优化模型,我们对ExPAsy蛋白酶数据库的所有91,140个蛋白酶进行高通量预测分析,共发现了2,641个潜在的MFEs。为进一步验证预测结果,并深入全面了解MFEs,我们也对已知和预测的MFEs进行了结构、功能和进化等多方面的统计分析。结果发现,MFEs在物种间并不是均匀分布的,没有可靠的证据显示复杂生命形式比简单的生命形式更喜欢MFEs。对已有的蛋白质三维结构分析发现,α/β折叠结构是MFEs中较为偏好的结构模式。在对MFEs参与KEGG细胞通路的进一步分析表明,90%的MFEs参与了代谢相关细胞过程,尤其是糖,核苷酸和氨基酸代谢。另外,几乎占一半(MCD-MFEs∶48.7%SMAD-MFEs∶54%)的MFEs只参与一个细胞通路,而其他MFEs参加多个细胞途径,甚至多达5个独立的细胞通路。在本项目中,我们也构建了一个多功能酶综合数据库,以提供已知和预测MFEs的相关信息,该数据库可通过如下网址免费查看并使用:http://bioinf.xmu.edu.cn/dalabases/MFEs/index.htm