论文部分内容阅读
蛋白质是生命不可或缺的物质基础,也是生命活动的主要承担者。因其对于生命的重要性,人们对蛋白质的研究热情从未衰减,其中蛋白质的结构与功能一直都是科学领域的研究热点。研究蛋白质构象空间对于研究蛋白质结构和功能的关系来说是极其重要的,不同构象之间的动力学信息也是研究蛋白质结构和功能关系的重要的宝贵数据来源。动力学上的结构相关性是蛋白质别构效应的基础,绝大多数生物学相关的别构效应在空间上是远程的。了解结构相关性,尤其是在空间远程的相关性,对阐明蛋白质别构机制并操纵蛋白质别构是非常必要的。本篇论文以溶菌酶蛋白质HEWL(Hen Egg White Lysozyme)在自然折叠状态下的长时间分子动力学模拟轨迹为数据来源,分析了HEWL蛋白质内部空间远程相关性,并对可能的别构效应调节位点进行预测,形成了一套蛋白质内部空间远程相关性的计算分析方法。首先,分析了HEWL蛋白质的主链二面角的分布情况,由于蛋白质结构非常稳定,大多数主链二面角只有一种主要状态,但存在着部分主链二面角有两种及以上的主要状态,这些主链二面角的所在位置可能是蛋白质别构效应的关键位点。接下来计算了主链二面角之间的循环相关系数、互信息以及距离,分析了主链二面角之间的远程相关性,确定互信息对于分析HEWL蛋白质内部相关性更具优势,并探究了互信息与二级结构、距离之间的关系。发现较强的远程相关性主要存在于蛋白质结构的loop区之间。进一步的,依据某一个主链二面角的两种不同的状态将轨迹中的结构数据分为两个子集,计算了子数据集之间的互信息差异,发现两个主链二面角之间的相关性会受第三个主链二面角的影响,而它们在空间上可能相距较远;通过作出互信息差异在主链二面角之间的距离上的分布图,进一步分析了互信息差异与距离的关系,一些二面角虽然距主链二面角对距离较远,但仍能影响主链二面角对的相关性。为了更好的阐释第三个主链二面角对于主链二面角对之间相关性的影响,计算了每三个主链二面角之间的交互信息,分析了三个主链二面角之间的空间远程相关性,并且与子数据集相关性分析相比,该方法对于分析三者之间的相关性更加可靠。接下来将分析对象从主链二面角延伸到残基,计算了每两个残基之间的互信息,分析了残基之间的空间远程相关性。最后,基于主链二面角和残基的空间远程相关性分析,本文对可能的别构效应调节位点进行预测,并与已知位点位置比对。分析蛋白质内部的相关性可以进一步构建蛋白质相关性网络模型,进而更准确的预测蛋白质别构效应的调节位点以及优化蛋白质设计。