论文部分内容阅读
蛋白质复合物在生物体内起到信号传导、物质输送等很多生理功能。由于蛋白质的三维结构决定其功能,故通过计算手段预测蛋白质结构可以帮助在实验结构未知的情况下对其功能的理解。但目前复合物结构预测仍是一项艰巨的任务。由于蛋白质在复合过程中常发生局部结构变化,所以预测复合物结构时柔性处理就变得异常困难。本文研究一个柔性区域识别问题以及应用图概率模型到柔性对接问题中。首先研究了GPCR结构中柔性区域的识别问题,因为GPCR在制药领域中占有极其重要的地位。跨膜螺旋结构是GPCR非常显著的特征之一,然而螺旋结构往往存在柔性形变。这些柔性形变会导致GPCR结构预测精度不高,那么对螺旋柔性形变识别预测至关重要。本文根据螺旋序列相似度矩阵进行聚类,用连续型vonMises概率分布来对每个类中柔性形变角度集建模。训练后的概率模型只需十五次采样,就有采样结果接近天然螺旋的形变角度,能够很好的帮助螺旋的柔性识别预测。提高柔性形变识别预测精度,能够帮助GPCR结构预测和对接过程中的柔性处理。其次在蛋白质-蛋白质对接协议Rosetta Dock基础上加入了骨架柔性运动来加大采样空间以提高对接精度。要提高复合物的预测精度,不仅要提高柔性对接的采样能力,还要提升能量打分函数对对接结果的挑选能力。由于大量柔性的引入导致对接结果采样空间变大而使得能量分布宽度加大,给能量函数提出了更大的挑战。本文采用概率模型matrix Bingham-von Mises-Fisher对残基交互图建模,后使用该概率模型回归对候选结构进行概率打分。由于残基交互图可以把生化知识在结构上定性化表达,能够作为结构挑选的依据。本文的模型方法在能量函数挑选效果不好的对接案例中,能够作为能量函数进行柔性对接结构筛选的辅助手段。