一种基于片段和图论的配体-蛋白质对接方法及用同源模建受体结构的对接测试

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lglglglglg18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算分子对接被广泛应用于蛋白质-配体结合研究和基于结构的药物设计。在蛋白质-配体对接研究中,受体蛋白的三维结构极为关键。当受体结构来源于配体-受体复合物晶体结构且其中配体与对接的目标配体高度相似时,各类对接方法的表现往往是最好的。在很多测试研究中,输入的受体结构是在受体和相应目标配体形成复合物的状态下被测定的。这类计算被称为结合对接。分子对接的实际应用不会是结合对接,因为配体-受体复合物结构就是我们希望通过对接得到的主要结果之一,即受体与目标配体形成复合物时的准确结构是未知的,无法用作输入。不使用受体与目标配体结合状态的结构来进行的对接计算称为非结合对接,其所使用的受体结构可能源于无配体结合的受体蛋白或受体蛋白与其他配体的复合物。在更加极端的非结合对接中,没有任何已知受体的实验结构可用,而只能用同源模建的受体结构开展对接。由于模建结构准确性无法比拟高分辨晶体结构,常规对接算法应用于模建受体结构时,特别是在处理较大配体分子时,结果会显著变差。本工作中,我们描述了一种基于片段的对接方法。和常规对接方法相比,这一方法对于受体结构的精度较不敏感。在此方法中,我们先用分子片段而不是完整的配体和受体结构进行对接。相比于完整配体,小而刚性的分子片段能更有效、全面地探索结合口袋。由于不同的片段独立地探索它们各自合适的结合位点,最终对接结果对模建受体结构的整体精度可能较不敏感。在获得了片段的一系列有利(高分值)结合结构或结合姿态(binding poses)后,我们使用图论方法来寻找完整配体和其组成片段的有利结合姿态之间的结构匹配,从而获得完整配体的候选结合姿态。在这些配体结合姿态下,组成配体的各分子片段处于通过片段对接获得的、能量有利的结合位置。最终各结合姿态将进一步被优化、打分和排序。为确立这个新对接方法的有效性,我们首先测试了用AutoDock进行片段对接得到的片段结合姿态是否足以覆盖对应片段在已知的配体-受体复合物中的实际结合位置。我们总共分析了二十种不同分子片段。基于AutoDock打分,若考虑排名前20%的结果,则对接片段的姿态复现已知配体-受体复合物中的片段位置的成功率可达75%。接下来我们用若干细胞色素P450-底物复合物来测试整个对接过程。首先我们测试了结合对接,即用目标底物-酶复合物中的细胞色素P450结构作为受体。我们还测试了用细胞色素P450蛋白的同源模建结构作为受体结构的非结合对接。我们把用片段对接所得的结果和用AutoDock对接完整配体得到的结果进行了对较,结果表明我们的方法在所有系统中都成功地获得了与实验结构相近的结合姿态。我们用结合打分函数对对接得到的结构进行排序,保留一定比例的高分结果,并基于保留下来的结果中是否包括近天然的结合姿态来定义成功率。对于结合对接,如果取排名前3%的结果进行分析,则成功率可达100%。在用同源模建结构进行对接的测试中,如果考虑排序前20%的对接结果,则成功率为50%;如考虑排序前10%的对接结果,则成功率为25%。我们还发现我们的方法应用于对接较大的配体和同源模建结构时具有很大的优势。以一个较大配体为例,使用基于片段的方法可以得到和实际配体姿态相比最小均方根位移(RMSD)为0.84 A的结构,而使用AutoDock则只能得到最小RMSD为5.68 A的结果。在对接时,同一配体分子可能处于不同构象,我们事先未知哪个才是其与受体结合的构象。因此在一个例子,我们考虑了对不同的配体构象进行对接,以考察对接结果是否能够复现实验确定的结合构象和结合姿态。和实际配体结合结构相比,我们得到了最小RMSD为1.37 A的结果。这些测试表明本文提出的基于片段和图论的方法是一种能以模建蛋白结构作为受体、对分子量较大的配体进行配体-蛋白对接的有效方法。
其他文献
自1912年宇宙线被发现以来,人们对宇宙线的研究已有一百多年。然而宇宙线的起源却一直是一个科学难题,目前人们普遍认为银河系内宇宙线主要是由超新星遗迹加速产生。由于星际磁场的存在,人们很难通过对宇宙线的测量得到加速源的信息。但是,高能宇宙线粒子可以通过不同的辐射机制产生伽马射线辐射。随着地面和空间伽马射线望远镜的不断发展,越来越多的超新星遗迹以及其他伽马射线源被发现,这些不断积累的观测数据为我们研究
地球辐射带是由大量捕获在地球磁场的高能带电粒子组成,主要位于1.2-8个地球半径之间,这些能量粒子会对在轨航天系统造成多种故障,并给宇航员的健康带来严重威胁。合声波与高能电子的相互作用在辐射带电子的演化过程中有着非常重要的作用。目前研究表明,夜侧合声波是由~keV-100 keV的各向异性电子激发形成,但日侧合声波的激发机制和传播特性仍需进一步研究。本论文主要通过多卫星观测数据分析与处理,结合理论
自从活动星系核(AGN)被发现以来,它的非周期性光变就为人所知;这样的光变覆盖了从射电波段一直到X射线、伽玛射线波段。近年来,随着时域天文学的发展,活动星系核的光变研究越来越得到重视。对活动星系核光变的研究,能极大的推进我们对活动星系核方方面面的理解,包括其吸积盘的辐射及尺寸、宽发射线区气体的分布及物理、吸积盘和X射线冕区之间的联系、红外辐射的过程和物理性质等等。此外,对光变的理解也能帮助我们从光
日冕物质抛射(coronal mass ejection,简称CME)是太阳大气中剧烈的爆发现象之一。其爆发通常能释放大量的能量并抛射大量磁化等离子体。当CME的运动速度超过当地快磁声速时,CME能够驱动激波形成。而CME所驱动的激波则能进一步导致太阳高能粒子事件(solar energetic particle,简称SEP)的发生。CME是引发地磁暴主要原因之一,而由其驱动激波产生的太阳质子事件
尘埃环(torus)是活动星系核(AGN)统一模型的关键成分,它位于宽线区外侧,在不同视角下其对于吸积盘区域和宽线区不同程度的遮蔽造成我们观测到不同类型的活动星系核,如光学type-1/2活动星系核、X射线遮蔽/未遮蔽活动星系核等。torus吸收紫外、光学等短波光子后会使得物质被加热,而这部分能量最终会以再辐射的形式产生峰值位于20-70 μm的红外辐射。细致研究活动星系核的红外辐射不仅可以帮助我
甲醇脉泽在厘米波和毫米波波段有大量跃迁线,且在恒星形成区普遍存在,可作为研究恒星形成的强大工具,这使它们成为近几年来研究的焦点。甲醇脉泽根据成协天体和抽运机制的不同,分为Ⅰ型甲醇脉泽和Ⅱ型甲醇脉泽。其中Ⅰ型甲醇脉泽(如:44 GHz和95 GHz)通常存在于在外流驱动的激波环境。它对所在区域恒星形成的激波环境和大质量恒星形成过程中多种脉泽的演化关系的探索都有着十分重要的意义。然而相比银河系其他脉泽
本文将介绍三个方面内容:Gaia DR2天体测量数据中疏散星团的搜寻与认证,利用疏散星团研究银河系旋臂结构,以及利用恒星视差与消光数据研究星际尘埃分布。我们采用了一种无监督机器学习算法DBSCAN来对恒星的天体测量数据进行聚类,该聚类算法的难点在于最小半径参数的选择。在综合了前人的各种方法的基础上,我们给出了一套原创的聚类参数获取方法:kthNND拟合双峰高斯函数交点法,并利用这种方法在银道面|b
《指南》指出,要"珍视幼儿生活和游戏的独特价值","游戏是小孩子的工作"。幼儿教育需要重视游戏对于幼儿成长的价值,践行游戏化理念,让幼儿的学习、课程实施游戏化,让游戏成为幼儿生活中的一部分,让幼儿在游戏中快乐成长。为做好幼儿教育,让幼儿在学习中快乐、自由探索,就应该将游戏化理念引入幼儿教育中,依托幼儿游戏的教学模式,打造"有质量"的幼儿教育。本文将对幼儿游戏的组织类型、支持策略及注意事项等进行简单
【目的】探讨益气活血法对缺血性脑中风急性期大鼠脑组织炎症的作用及机制。【方法】将47只SD大鼠留取9只作为假手术组,其余大鼠建造缺血性脑中风急性期模型。将造模成功的30只大鼠随机分为中药低、高剂量组及模型组,每组10只。中药低、高剂量组灌胃益气活血方汤药4.4、8.8 g/kg,模型组、假手术组灌胃等体积生理盐水,每天1次,连续给药15 d。给药第3、5、7天,测定大鼠神经功能变化;给药结束后,以
脊椎动物在它们的心血管及消化系统的结构和位置上都显示出惊人的左右不对称的特征,例如心脏位于左侧,而肝脏位于右侧。起初,早期的胚胎会沿着预定的体轴的中线进行对称的发育,这种胚胎的对称发育会在体节期随着左右组织者(left-right organizer,LRO)内纤毛的产生和不对称的液流的出现而被打破。左右组织者是位于脊柱末端的的一个暂时的器官。在斑马鱼中,被纤毛所覆盖的左右组织者就是指KV囊泡(K