论文部分内容阅读
蛋白质是生物体的基本组成成分,在遗传复制,构建组织,激素调节,生殖免疫等各方面都有不可替代的作用。蛋白质由20种氨基酸残基通过肽键键合而成,其一级序列,高级结构决定了蛋白质的结构和功能。对于蛋白质的模拟研究从计算机的诞生以来就一直是一个重要的课题。首先,蛋白质是如何由一级结构折叠到三级或者四级结构的过程很难由实验来观测到,其间的相互作用过程也很难确定,于是蛋白质折叠一直是生物计算机模拟的一个重要挑战。另外,药物分子要对生物体发挥作用,首先是要找到靶点,然后与靶蛋白分子相互作用才能完成治疗,所以蛋白质和小分子的相互作用问题在分子筛选和制药方面有非常重要的意义。进入二十一世纪一来,计算机硬件技术的疯狂提升,在当下未来,我们已然能够很好的对蛋白质进行深入细微的研究。利用全原子的分子动力学方法(Molecular Dynamics),可以研究蛋白质的折叠,吸附等各种物理现象,乃至于全原子的复杂生物环境中蛋白质与各种分子的相互作用,从生物和物理上了解蛋白的功能机理。我研究蛋白质方面的主要内容分为三个部分: 1,蛋白质和适配体的相互作用打分函数,用来评价蛋白和适配体的结合强弱。我们使用一种新的迭代的方法,我们发展出了一种基于先验知识的打分函数(AScore),并把它用来预测蛋白质和小分子复合物的结合能力。 AScore的原子对势从677个蛋白质和小分子的复合物的训练集(此训练集来自蛋白质数据库,PDB,Protein Data Bank)中通过反复训练提取出来。通过.Mol2这种标准格式中对于各种原子类型的分类,我们划分了16中蛋白质的原子类型和26种小分子的原子类型。整个迭代过程避开了得到这种基于知识的打分函数时长期存在的一个难题,那就是参考态的获得。AScore的基本思想就是通过数学迭代来改进原子对势,直到他们能够准确的从训练集合中的大量的非最佳配对复合体中区分出实验上最好的对接匹配模式。这种迭代的方法非常有效,而通常在20个迭代步里面就能够收敛。最终我们把得到的AScore用在一个全新的140个蛋白质和小分子的复合体的集合中来测试其性能,结果是得到了0.74的高协同系数,也就是说,AScore比之前是用的大部分的打分函数都更为快速和有效。 2,用Monte Carlo方法来进行粗粒化的蛋白分子被吸附到底物上的热力学研究。使用非格子模型的Monte Carlo模拟和副本交换方法,我们从正则和微正则两个角度研究了未被接枝在吸引底物表面上的均聚物蛋白高分子粗粒化模型的吸附行为。我们可以从正则比热峰来确认,相比较传统的一端接枝在吸附底物的表面上的高分子来说,此过程发生了一个吸附转变。从微正则系综下的“回折效应”(“backbending effect”)和负比热来判断,这个转变在相对强的吸附时,是一个类似于一级相变的转变;然而,在吸附足够弱的时候,它又变成了一个类似于二级相变的转变。进一步的研究解释了对于有限长度的分子链来说,这种转变的类型可以在一级和二级相变间相互转换,这种转换不仅仅取决于单体单体以及单体和底物的相互作用,也取决于单体的受限区域的尺寸。 3,剪切保护端粒酶TelK在DNA复制过程中的的全原子的分子动力学模拟。使用分子动力学软件NAMD和动力学分析软件VMD,我们研究了剪切保护端粒酶TelK在特殊位点结合到DNA上并最终将其扭曲剪切完成DNA复制的机理。我们对TelK的双聚体进行了4个标准的分子动力学(MD)研究,分别是:TelK二聚体∶DNA复合体;(从报道在[1]获取结构信息,ProteinDataBank code2V6E,此段DNA包含44碱基对:CACACAATTGCCCAT-TATACGCGCGTATAATGGACTATTGTGTG,其中粗体的碱基是TelK双聚体的结合位点,也就是说TelK双聚体会识别这个序列)第二个模拟的对象是没有DNA结合的TelK二聚体;第三个是被去除掉Stirrup域(残基序列号445-535)的TelK二聚体和DNA复合物;第四个模拟,TelK二聚体和DNA的复合物,其中DNA的结合位点的序列CGCGCG(参见上方)变异为GTAGCG。所有的模拟都监控RMSD值,接触面积和TelK单体的执行距离等等观测量。我们总结TelK二聚体和DNA的复合物是相互作用的,并不由其中一方完全控制;DNA被TelK二聚体扭曲,最终被其剪切。TelK的结构在这个结合并且剪切DNA的过程中起到了非常大的作用,其他诸如DNA序列,氢键还有其他的因素也有很重要的贡献。