论文部分内容阅读
本实验室已经开发的虚拟组合化学衍生程序AVAL,以分子骨架为母体,通过变化其取代基,能够生成大量母体骨架的衍生分子。如果采取常见的分子对接等方法来挑选组合化学所生成的大量分子,从时间和计算机资源来看,都不是切实可行的好方法。如果能够有效地对组合衍生进行控制,那将大大减轻虚拟筛选所面临的困难。因此,组合衍生下一步面临的问题,就是选择什么样的取代基,更有目的地控制衍生分子,使它们与受体的结合有更大的成功保障。
蛋白质是最主要的药物分子受体。蛋白质晶体结构数据库(PDB)中现在有超过40,000个蛋白质晶体结构,其中超过30,000个蛋白质结构中包括配体小分子,配体小分子结构达7,000多个。这些配体和受体之间的相互作用关系蕴含大量的信息,特别是配体中与受体直接作用的取代基,对于设计新的分子具有重要的参考意义。
为此,论文提出一种新型的、基于数据库信息的概率式取代基选择方法(Substituents Selection by Database Information,SSDI)。通过整理PDB及其衍生数据库如MSDsite等数据,可以得到哪些配体分子的哪部分取代基与哪些蛋白质残基按照何种作用方式结合的信息。因此,通过统计数据库蛋白质残基及其对应的配体取代基,就可以根据目标受体的残基情况,选择那些统计频率较高的取代基,这样比随机地选择取代基会更有目的性,设计出来的配体有可能与蛋白质残基更有效地发生作用。SSDI用统计概率的方式,回答了组合衍生所面临的选择什么样取代基的问题。
由于取代基含义的灵活性,SSDI并不是一个固定的系统,而是提供一种模式。应用时可以根据需要,输入感兴趣的取代基并获得其统计频率。为了验证SSDI,选择了HIV-1抑制剂沙奎那维(Saquinavir)作为定义取代基的参考,然后对PPAR7的6种己知配体进行了取代基统计频率与生物活性的比对。
SSDI是用C/C++、Perl和MySQL数据库开发完成的。