论文部分内容阅读
本论文通过对蛋白质数据库(PDB)的统计,发现精氨酸-精氨酸二聚体碳…碳(CZ…CZ)作用距离在5之内的蛋白质占数据库的1/3。这种看似违背常理却普遍存在的,带同种正电荷的精氨酸-精氨酸二聚体引起了我们的注意。本文对它们在蛋白质数据库中的出现进行了系统的调查和分析,并且对它们稳定存在的原因进行了相关计算和研究。1.蛋白质数据库(PDB)的统计在PDB数据库中,我们选择分辨率为2.0以及更好的蛋白结构作为研究对象。我们把两个精氨酸残基碳…碳(CZ…CZ)作用距离在5之内的称作精氨酸-精氨酸二聚体。考虑到PDB数据库的冗余性,我们使用Dunbrack实验室的6344条蛋白质链的非冗余数据库进行了进一步分析,发现25.2%(1599/6344)的非冗余蛋白质结构中含有一对或者一对以上精氨酸-精氨酸二聚体。说明精氨酸-精氨酸二聚体在蛋白质中普遍存在。在对PDB数据库精氨酸-精氨酸二聚体的统计中,我们发现所有的精氨酸-精氨酸二聚体都位于由不同基团构成的极性环境中。构成极性环境的基团有酸性氨基酸、水分子,以及结合位点附近的强极性的、可极化的基团,合位点附近的带负电的基团,还有与小分子结合的强极性的、可极化的基团,与小分子结合的带负电的基团。PDB数据库统计结果表明,在这些极性环境中,大部分的精氨酸-精氨酸二聚体是暴露在水溶剂中,与水分子作用的。对PDB数据库统计结果进一步分析,发现68.3%的精氨酸-精氨酸二聚体是通过与酸性氨基酸形成精氨酸-精氨酸-天冬氨酸/谷氨酸三聚体而稳定存在的。2.蛋白质介电常数以及酸性氨基酸对精氨酸-精氨酸二聚体的稳定作用我们采用包含色散作用的密度泛函方法(DFT-D)研究蛋白质介电常数对精氨酸-精氨酸二聚体稳定性的影响。研究发现,当介电常数增加到46.8(二甲亚砜)时,精氨酸-精氨酸二聚体达到热力学上稳定(约-1kcal/mol)。结构优化与能量计算表明,在介电常数比较小(小于4.8,三氯甲烷)时,精氨酸-精氨酸二聚体倾向于以垂直结构存在(平行构型的两个精氨酸相互排斥,不能形成精氨酸-精氨酸二聚体);而当介电常数增大(大于5.6,二氯乙烷)时,他们倾向于以平行的结构存在(平行构型比垂直构型更稳定)。酸性氨基酸对精氨酸-精氨酸二聚体有着强烈的稳定作用,在介电常数从2.0到78.4的范围内,它使精氨酸-精氨酸二聚体的相互作用能降低到-154到-22kcal/mol。3.精氨酸-精氨酸二聚体和精氨酸-精氨酸-天冬氨酸/谷氨酸三聚体的能量分解分析在ADF程序中,用PBE方法和DZP基组,分别对精氨酸-精氨酸二聚体和精氨酸-精氨酸-天冬氨酸/谷氨酸三聚体的相互作用能进行分解,发现对他们起主要稳定作用的作用项是不同的。对于精氨酸-精氨酸二聚体来说,主要的稳定作用项是溶剂化能,它对精氨酸-精氨酸二聚体吸引作用的贡献高达90%;对于精氨酸-精氨酸-天冬氨酸/谷氨酸三聚体来说,主要的稳定作用项是静电作用能,它对精氨酸-精氨酸-天冬氨酸/谷氨酸三聚体吸引作用的贡献有75%。本论文的研究结果有助于理解蛋白质结构中精氨酸-精氨酸二聚体的存在,对精氨酸-精氨酸二聚体在药物设计中的运用有一定的指导作用。