论文部分内容阅读
随着人类基因组计划的完成,生命科学的研究进入了后基因组时代,其主要研究内容是功能基因组学和蛋白质组学,而揭示蛋白质的结构与功能之间的关系及蛋白质-蛋白质相互作用规律是蛋白质组学研究的重要组成部分。其中最重要的课题之一是蛋白质-蛋白质相互作用与识别的研究。该研究具有广泛的理论和现实意义,有助于揭示蛋白质发挥其生物学功能的分子机制,进一步理解生命活动的微观过程,并为基于蛋白质结构的药物设计提供理论指导。
由于实验测定蛋白质复合物结构存在较大的困难,因此在计算机处理能力不断增强的情况下,研究蛋白质结构的理论模拟方法得到迅速发展和广泛应用。采用分子对接方法进行复合物结构预测,已经成为蛋白质-蛋白质间相互作用和识别研究的有力手段。在复合物结构预测过程中,结合位点预测在缩小搜索空间进行精细对接和确认正确结构方面起着重要的作用。本文对蛋白质结合位点预测方法进行了一些基础性的研究,将提出的预测方法应用于CAPRI Farget39复合物结构预测,取得了较好的成绩,并根据该方法建立了蛋白质结合位点网络预测服务器。
(1)蛋白质结合位点预测方法研究及在CAPRI Target39复合物结构预测中的应用
本文选取CAPRI竞赛委员会提供的数据集Benchmark3.0中的双链蛋白质复合物作为研究对象,计算了蛋白质单体的残基溶剂可接近表面积(A)和残基间的接触面积(C),并根据计算结果提出了蛋白质表面模块划分方法。通过对每个模块的这两个参数的分析,发现模块的溶剂可接近表面积与模块的内部接触面积的乘积(PAMA)值,可以提供蛋白质-蛋白质复合物结合位点的信息。在78个双链蛋白质复合物体系中,受体或配体拥有最大PAMA值的模块是界面模块的体系有60个,74个体系的受体或配体拥有最大或次大PAMA值的模块是界面模块。将该方法获得的结合位点信息应用在CAPRI竞赛Round17 Target39的复合物结构预测中取得了较好的结果。本文提出的基于模块的蛋白质结合位点预测方法不同于传统方法中以残基为基础且仅考虑表面残基的预测方法,为蛋白质-蛋白质相互作用中结合位点预测方法研究提供了新的思路。
(2)蛋白质结合位点预测服务器PAMA
根据上述提出的蛋白质结合位点方法,我们建立了蛋白质结合位点网络预测服务器PAMA(http://bioinformatics.bjut.edu.cn/pama)。该服务器采用的编程语言是PHP和Perl,数据库采用的是MySQL。在服务器的界面控制和显示上使用灵活的PHP语言,而在计算和数据处理方面,我们采用的是Perl脚本语言。
服务器架构简单,输入界面简洁。不需要用户提交任何的个人资料和注册,便可以提交作业进行计算。计算完成后,计算结果不需要通过Email来发送,而是采用Jmol插件进行可视化的及时显示,并且结果数据和页面将在服务器上保存一周,以节省用户再次提交相同作业时计算等待的时间。对于单一提交的计算任务,PAMA服务器的处理过程为2分钟左右。