论文部分内容阅读
蛋白质是组成生物有机体的基本大分子之一,在生物体的生命过程中起着非常重要的作用。蛋白质的结构决定了蛋白质的功能,要对生物学很多领域进行深入的研究,就需要深入了解蛋白质的三维结构。凋亡蛋白质可以分为抗凋亡蛋白质和促凋亡蛋白质,它们对细胞凋亡有着相反的调控作用。所以对抗凋亡与促凋亡蛋白质高级结构的研究,以及基于对高级结构信息的识别,能使我们更好地了解凋亡蛋白质是如何发挥功能的。本文针对SwissProt数据库所建立的数据集A-P 461中的239条抗凋亡蛋白质与222条促凋亡蛋白质数据集进行结构域、模体信息的搜索与分析,发现了抗凋亡蛋白质和促凋亡蛋白质所特有的结构域和模体结构,也发现了部分结构域、模体信息是抗凋亡与促凋亡蛋白质所共有的。在PDB数据库中找到上述结构域的二级结构和三级结构,再利用MEME搜索序列模体,从而提取出具有凋亡作用的保守的高级结构的特征与信息,这些特征信息可以为抗凋亡与促凋亡作用机制的研究提供帮助。本文还构建了每条蛋白质都有结构域、模体注释信息的抗凋亡与促凋亡蛋白质数据集A-P 513。以蛋白质序列组分信息、蛋白质序列亲疏水组分信息、蛋白质骨架信息、氨基酸序列N端组分信息、氨基酸分段单肽信息、序列进化信息和结构域模体信息作为特征参数,用支持向量机的算法,在Jackknife检验下对抗凋亡蛋白质与促凋亡蛋白质的分类进行预测。并分别对单特征预测结果与融合特征预测结果进行分析与讨论。