论文部分内容阅读
在许多真实体系中,虽然个体之间的相互作用比较简单,但在更大的尺度上系统往往会表现出一些新现象,即涌现行为,这样的系统通常被归类为复杂系统。复杂系统的涌现行为是科学探究的核心问题。对于这类行为,我们难以直接用已有的物理学规律来描述。近年来,为了描述这类复杂系统的行为,人们一直在尝试发展新方法,其中复杂网络方法被认为是研究复杂系统行为的一个有效方法。生物体系是典型的复杂系统,其在不同的层次上都会表现出复杂行为。其中,蛋白质等生物大分子层次的行为尤其引人关注。蛋白质分子不仅是构建生物个体的物质基础,而且是各种生物功能的主要执行者,在生物体内发挥着极其重要的作用,是典型的复杂系统。为了执行生物学功能,蛋白质通常需要折叠到特定的三维立体结构,因此需要残基间的相互作用足够强,能够使蛋白质分子实现快速折叠,并能维持在稳定的三维结构。另一方面,蛋白质在执行生物学功能时,需要具有合适的柔性,能够在不同的构象之间快速转变,从而要求残基间的相互作用不能太强,蛋白质分子不能太稳定。因此,蛋白质折叠和功能运动对蛋白质的稳定性要求相互冲突。人们猜测,为了同时满足以上关于蛋白质稳定性的矛盾要求,蛋白质的氨基酸序列通过进化,使得蛋白质分子处于临界状态附近。在临界状态附近,蛋白质既具有最大的柔性,同时又保持了结构的完整性,从而保证稳定性和适应性之间的平衡。揭示这种蛋白质分子的临界行为是近年来生物物理领域的一个挑战性课题。在最近的一项研究中,人们基于天然态蛋白质核磁结构数据,通过分析氨基酸位置涨落的关联性质,发现氨基酸的关联长度存在无标度性,从而从结构动力学的角度展示了天然态蛋白质处于临界状态。考虑到这种临界行为是蛋白质氨基酸序列进化的结果,而且已有的序列信息远比结构信息丰富,因此从氨基酸序列的层次揭示这种临界行为是更基本的出发点,也更具挑战性,目前尚未见相关工作报道。本论文中,我们基于复杂网络方法,通过构建共进化氨基酸网络,从氨基酸序列的层次揭示出蛋白质分子的临界行为特征。同时,通过对一系列具有催化功能的蛋白质分子(即酶)的共进化氨基酸网络分析,提出催化活性位点残基与共进化氨基酸网络拓扑特性之间的关联,从而提供了一种基于氨基酸序列预测酶催化位点的方法。具体工作总结如下:(一)基于共进化分析的蛋白质氨基酸网络统计特征与临界行为。通过对蛋白质家族的氨基酸序列进行序列比对,提取关于不同位点氨基酸突变的相关性,即共进化信息。在此基础上,基于最大熵算法和平均场近似,对共进化信息进行直接耦合分析,计算出表征氨基酸之间直接耦合强度的直接作用信息,并以此为依据,将存在直接耦合的残基对相连接,构建出共进化氨基酸网络。基于所构建的共进化氨基酸网络,对网络的边权统计性质以及节点关联性质进行了统计,主要结果有:1)网络的边权分布服从幂律分布规律。这表明网络中存在少数关联很强的残基对,这部分关联较强的残基对在蛋白质的折叠和执行生物学功能中起着非常关键的作用,有助于蛋白质分子维持整体结构稳定性并实现特定的生物学功能,并能有效地响应不同强度的外界扰动。2)基于力学模型和序列关联信息,分别研究共进化网络的长程关联特性,发现关联长度和体系大小总是呈现单调递增的关系,这表明体系没有固定的关联长度,呈现无标度的特征。3)分析了加权网络的分形特性。计算结果表明,信息熵随着盒子大小呈现幂函数关系。这表明了系统具有分形特性。以上关于共进化网络的三个方面的性质都是系统处于临界状态附近的典型特征,因此相关结果从序列的层次展示出自然界的蛋白质分子处于临界状态附近。(二)基于共进化分析的酶催化位点拓扑性质分析。酶催化是蛋白质最典型的生物学功能。基于序列信息预测酶催化位点是人们努力实现的目标之一。本工作详细分析了一系列典型酶分子的催化位点和共进化网络拓扑性质的相关性,发现酶催化位点通常表现出特殊的中心性质,包括度中心性、介数中心性、紧密中心性、以及拉普拉斯中心性等。这一结果为利用共进化信息识别蛋白质的重要功能位点提供了一种可能。另外,对催化位点在共进化网络上的近邻残基的结构性质进行分析发现,与催化位点耦合较强的残基通常会在空间上有直接接触,并且不同催化位点的耦合残基倾向于形成相对独立的模块。这一结果说明,对不同催化位点残基的功能动力学进行调控的路径具有一定的独立性。总之,本论文基于复杂网络方法,从序列的层次揭示出自然界蛋白质分子的临界行为,并建立了共进化网络拓扑性质与酶催化位点的相关性。相关结果为蛋白质分子的序列-结构-功能关系提供了新理解。