论文部分内容阅读
药物发现中,迭代分子设计是一种定向进化过程。经典的设计周期是设计、合成、分析和测试的多轮循环过程,费时费力且成本巨大。近年来,计算机硬件和药物设计方法学的不断发展为加速这一复杂的过程提供了更多新的思路。本文主要是利用并发展匹配分子系列分析和主动学习等方法,针对于药物设计中,先导物优化项目的生物活性预测,ADME/T性质估计以及分子作用机制研究的科学问题进行展开。研究工作主要包括三个部分,第一部分中,针对先导化合物活性优化问题,我们发展了基于匹配分子对和匹配分子系列的生物活性定量预测模型(第2章);第二部分中,以口服暴露量(AUCpo)为例,运用主动学习方法对ADME/T性质估计进行改进(第3章);第三部分则是利用匹配分子对分析,晶体结构解析及分子动力学模拟等多种手段,开展靶向视黄酸相关孤儿受体γt(RORγt)的功能渐变调节的分子机制研究(第4章)。在小分子药物发现进程中,提高化合物生物活性是先导化合物优化的核心任务。然而,进行反复多轮的化合物合成和生物活性测试是费时且费力的。开发一种高效的生物活性预测方法,用以在结构优化过程中辅助决策并减少试错过程将是可能的解决方案。第2章中,基于Ch EMBL数据库中大规模的结构活性关系数据,我们建立了两类生物活性定量预测模型。第一类是基于取代基的相似性的模型,通过匹配分子对分析方法实现,包括SA、SA_BR、SR和SR_BR模型。第二类方法为基于SAR传递性的模型,通过匹配分子系列分析方法实现,包括单MMS对、全MMS系列和多MMS对模型。此外,我们还利用基于距离的阈值来定义模型的应用域。在以上7个模型中,多MMS对预测模型对生物活性的预测效果最好(R2=0.828,MAE=0.406,RMSE=0.591),基线模型(SA)的预测效果最差(R2=0.798,MAE=0.446,RMSE=0.637)。通过构建一致性模型,获得了比所有单个模型更高的预测精度(R2=0.842,MAE=0.397,RMSE=0.563)。本研究可以为药物化学家合理设计高亲和力的化合物提供参考和帮助。人工智能技术在药物发现中扮演着越来越重要的角色。但该方法却受限于对大量有标签数据的需求,而这一需求却与药物研发管线致力于测试尽量少化合物的目标恰恰相反。近期,主动学习概念因仅需要少量标签数据来训练和更新模型而受到了广泛关注。第3章中,我们选择了一个低数据量的案例场景:药物口服暴露量——评价候选药物吸收程度的重要药代动力学参数之一,详细描述了多种主动学习策略的预测效果。通过回顾性分析发现,基于熵的查询策略能采样较少的实验数据(减少70%以上的标记数据),并获得了预测精度更高的分类模型。我们从基于熵的不确定性查询策略所获得的最优模型出发,从大型化学空间中进行采样,并将其实验结果反馈到模型中。通过两轮的样本挑选和模型再训练,结果表明:每轮增加的10个实验数据点,均使得模型的预测性能有了进一步的提升。我们第一次通过实验验证了主动学习在接近真实世界的应用中解决药物研发中的低数据量问题的潜力。本研究对提高人工智能模型的准确性和泛化能力以及在药物研发管线中应用主动学习工作流具有借鉴意义。小分子RORγt反向激动剂和激动剂分别对自身免疫性疾病和癌症具有潜在的治疗作用。虽然已发现了一些结构类似但具有不同功能类型的调节剂,但其分子机制仍待研究。在第4章的研究中,首先,我们对目前已报道的RORγt配体进行了匹配分子对分析,发现了功能翻转的MOA cliff现象,即分子结构相似但呈现相反作用。虽然其中也存在“短”反向激动剂→激动剂和激动剂→“长”反向激动剂的变化模式,但未发现在同一骨架下可发生“短”反向激动剂→激动剂→“长”反向激动剂的两次功能翻转现象。之后,通过与实验组开展合作,首先获得了咔唑酰胺反向激动剂6-RORγt复合物晶体结构,并给出了基于结构的合理设计,得到了一系列调节剂。并且利用X衍射晶体学技术,成功获得了RORγt与代表性激动剂(7d)和“长”反向激动剂(7h)的共晶结构。最后,对已获得的3个代表性复合物晶体结构,分别进行了1微秒的分子动力学模拟研究,对不同配体的分子作用机理进行了深入的探讨。我们发现激动剂与RORγt结合后,能够稳定Y502-H479氢键,进而稳定AF2区域,这与之前的报道一致。H479和Y502侧链二面角分析表明:“长”(7d)、“短”反向激动剂(7h)结合后,会引起Y502及H479朝不同方向翻转。并且,通过对H11-H11’-H12的RMSD值以及螺旋内部的氢键距离的监测,我们总结出了两种反向激动剂的作用模式模型:“短”反向激动剂会引发H11’解螺旋,从而使H12整体移位,虽然不能招募共刺激多肽,但由于保留了完整的H12螺旋结构,因而可以招募共抑制因子;而“长”反向激动剂则使得H11螺旋断裂,诱发H12的解旋,无法招募辅助多肽。该模型解释了不同配体在辅因子招募方式上的差异,对设计具有不同药物作用的小分子具有指导意义。