论文部分内容阅读
蛋白质翻译后修饰(post-translational modification,PTM)是一种十分重要的生命活动调控方式,可以改变蛋白质的结构并完善蛋白质的功能。因此深入研究蛋白质翻译后修饰的原理、种类、作用机制对于理解人类疾病的发病机制具有重要意义。近年来,随着实验技术的不断发展,积累了大量的蛋白质翻译后修饰位点数据,极大地推动了蛋白质翻译后修饰的研究进展。然而实验方法往往耗时耗力且成本较高,因此有必要发展高效、精确的计算方法预测翻译后修饰位点,为后续实验工作提供有用的参考信息。现有的计算方法大部分使用蛋白质氨基酸序列信息进行预测,忽视了蛋白质翻译后修饰间的功能联系信息。有研究表明in situ PTM指的是相同蛋白质同一个位点上发生多种翻译后修饰类型,可以反映出翻译后修饰间的功能联系。因此由多位点-多修饰相互作用关系的insituPTM启发本文从磷酸化相关位点-修饰网络的角度充分考虑网络拓扑结构信息,进而应用于翻译后修饰位点预测中来。本文主要研究内容如下:1、利用多种翻译后修饰数据库中收集的丝/苏/酪氨酸位点上的翻译后修饰位点数据,构建了磷酸化相关位点-修饰网络。在该网络的基础上,提出了基于资源配置的网络链路预测算法 SMNBI(site-modification network based inference)用于磷酸化位点预测。该算法主要利用网络中已知的链路信息对未知的位点与修饰相互作用关系进行预测。将SMNBI算法与现有的网络链路预测算法及磷酸化位点预测方法进行比较,结果表明磷酸化相关位点-修饰网络在磷酸化位点预测中发挥重要作用,能够大幅度提高预测精度。2、为解决磷酸化相关位点-修饰网络中孤立节点的预测问题,本文进一步提出了 多核支持向量机算法 MK-SVM(multiple kernels support vector machine)用于全面预测丝/苏/酪氨酸位点上的多种翻译后修饰类型。首先采用高斯核函数和氨基酸置换矩阵BLOSUM62分别设计了高斯互作谱相似性核和蛋白质局部序列相似性核,然后通过线性加权组合核函数的方式输入到SVM进行训练和预测。MK-SVM算法不仅有效解决了磷酸化相关位点-修饰网络中孤立节点的预测问题,而且可对丝/苏/酪氨酸位点上的多种翻译后修饰进行预测。与多种常用的翻译后修饰预测方法的比较结果显示,该算法对于磷酸化、O-GlcNAc、硝基化、硝化等翻译后修饰类型均取得了良好的预测性能。