匹配分子对分析和主动学习在药物设计中的发展及应用

来源 :中国科学院大学(中国科学院上海药物研究所) | 被引量 : 0次 | 上传用户:a443532159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物发现中,迭代分子设计是一种定向进化过程。经典的设计周期是设计、合成、分析和测试的多轮循环过程,费时费力且成本巨大。近年来,计算机硬件和药物设计方法学的不断发展为加速这一复杂的过程提供了更多新的思路。本文主要是利用并发展匹配分子系列分析和主动学习等方法,针对于药物设计中,先导物优化项目的生物活性预测,ADME/T性质估计以及分子作用机制研究的科学问题进行展开。研究工作主要包括三个部分,第一部分中,针对先导化合物活性优化问题,我们发展了基于匹配分子对和匹配分子系列的生物活性定量预测模型(第2章);第二部分中,以口服暴露量(AUCpo)为例,运用主动学习方法对ADME/T性质估计进行改进(第3章);第三部分则是利用匹配分子对分析,晶体结构解析及分子动力学模拟等多种手段,开展靶向视黄酸相关孤儿受体γt(RORγt)的功能渐变调节的分子机制研究(第4章)。在小分子药物发现进程中,提高化合物生物活性是先导化合物优化的核心任务。然而,进行反复多轮的化合物合成和生物活性测试是费时且费力的。开发一种高效的生物活性预测方法,用以在结构优化过程中辅助决策并减少试错过程将是可能的解决方案。第2章中,基于Ch EMBL数据库中大规模的结构活性关系数据,我们建立了两类生物活性定量预测模型。第一类是基于取代基的相似性的模型,通过匹配分子对分析方法实现,包括SA、SA_BR、SR和SR_BR模型。第二类方法为基于SAR传递性的模型,通过匹配分子系列分析方法实现,包括单MMS对、全MMS系列和多MMS对模型。此外,我们还利用基于距离的阈值来定义模型的应用域。在以上7个模型中,多MMS对预测模型对生物活性的预测效果最好(R2=0.828,MAE=0.406,RMSE=0.591),基线模型(SA)的预测效果最差(R2=0.798,MAE=0.446,RMSE=0.637)。通过构建一致性模型,获得了比所有单个模型更高的预测精度(R2=0.842,MAE=0.397,RMSE=0.563)。本研究可以为药物化学家合理设计高亲和力的化合物提供参考和帮助。人工智能技术在药物发现中扮演着越来越重要的角色。但该方法却受限于对大量有标签数据的需求,而这一需求却与药物研发管线致力于测试尽量少化合物的目标恰恰相反。近期,主动学习概念因仅需要少量标签数据来训练和更新模型而受到了广泛关注。第3章中,我们选择了一个低数据量的案例场景:药物口服暴露量——评价候选药物吸收程度的重要药代动力学参数之一,详细描述了多种主动学习策略的预测效果。通过回顾性分析发现,基于熵的查询策略能采样较少的实验数据(减少70%以上的标记数据),并获得了预测精度更高的分类模型。我们从基于熵的不确定性查询策略所获得的最优模型出发,从大型化学空间中进行采样,并将其实验结果反馈到模型中。通过两轮的样本挑选和模型再训练,结果表明:每轮增加的10个实验数据点,均使得模型的预测性能有了进一步的提升。我们第一次通过实验验证了主动学习在接近真实世界的应用中解决药物研发中的低数据量问题的潜力。本研究对提高人工智能模型的准确性和泛化能力以及在药物研发管线中应用主动学习工作流具有借鉴意义。小分子RORγt反向激动剂和激动剂分别对自身免疫性疾病和癌症具有潜在的治疗作用。虽然已发现了一些结构类似但具有不同功能类型的调节剂,但其分子机制仍待研究。在第4章的研究中,首先,我们对目前已报道的RORγt配体进行了匹配分子对分析,发现了功能翻转的MOA cliff现象,即分子结构相似但呈现相反作用。虽然其中也存在“短”反向激动剂→激动剂和激动剂→“长”反向激动剂的变化模式,但未发现在同一骨架下可发生“短”反向激动剂→激动剂→“长”反向激动剂的两次功能翻转现象。之后,通过与实验组开展合作,首先获得了咔唑酰胺反向激动剂6-RORγt复合物晶体结构,并给出了基于结构的合理设计,得到了一系列调节剂。并且利用X衍射晶体学技术,成功获得了RORγt与代表性激动剂(7d)和“长”反向激动剂(7h)的共晶结构。最后,对已获得的3个代表性复合物晶体结构,分别进行了1微秒的分子动力学模拟研究,对不同配体的分子作用机理进行了深入的探讨。我们发现激动剂与RORγt结合后,能够稳定Y502-H479氢键,进而稳定AF2区域,这与之前的报道一致。H479和Y502侧链二面角分析表明:“长”(7d)、“短”反向激动剂(7h)结合后,会引起Y502及H479朝不同方向翻转。并且,通过对H11-H11’-H12的RMSD值以及螺旋内部的氢键距离的监测,我们总结出了两种反向激动剂的作用模式模型:“短”反向激动剂会引发H11’解螺旋,从而使H12整体移位,虽然不能招募共刺激多肽,但由于保留了完整的H12螺旋结构,因而可以招募共抑制因子;而“长”反向激动剂则使得H11螺旋断裂,诱发H12的解旋,无法招募辅助多肽。该模型解释了不同配体在辅因子招募方式上的差异,对设计具有不同药物作用的小分子具有指导意义。
其他文献
2015年以来我国经济发展战略的主要方向是进行供给侧结构性改革。供给侧改革的主要任务是去产能,而去产能的关键是清理僵尸企业。近年来,我国有关僵尸企业的问题日渐严重,僵
随着矿用无轨辅运设备的标准化和产业化,无轨胶轮车作为无轨辅运的重要设备得到了广泛应用。无轨胶轮车是一种具有机动灵活、爬坡能力强和牵引性能好等特点且适用于大型机械化煤矿的高性能辅运车辆。但是,由于矿井下工作环境复杂、巷道较窄、光线较差、错车困难通讯调度不畅以及车辆行驶过程中受到振动和冲击现象等多因素影响,导致胶轮车运行性能不达标及调度不合理,井下作业过程中极易造成交通阻塞,甚至产生次生事故。为保障胶
二氟烷基通常被视为羟甲基、巯基、异羟肟酸或酰胺等基团的等排体,具有较高的脂溶性以及代谢稳定性,常常被用于药物以及生物活性分子的设计中。因此,发展二氟烷基化的新方法
本文选取互联网家装行业某初创型企业A公司为研究对象,对业务流程进行建模与重组分析,通过对比重组前后的流程指标衡量重组的效果,并为后续改进提供建议。文中主要提出了一种
2014年的夏季达沃斯论坛上,国务院总理李克强提出“大众创业、万众创新”的概念,在中国掀起了“双创”发展的新浪潮。如今,“双创”正在全国如火如荼的发展当中。如何帮助企
我国的煤炭市场无论是从宏观环境还是行业环境来看形势都比较严峻,煤炭企业的经营承受着很大的压力。这种环境推动了煤炭企业的转型,同时也给其带来了很多的风险,如何应对风
正如物理学上的杠杆一样,一个支点能撬动整个地球,金融学上的杠杆同样具有着“以小博大”的特点,通过各种渠道或途径借入资金,在自身拥有的资本金较少的情况下控制较大规模的
矿用胶轮车是煤矿辅助运输的关键装备,其在运行中容易因动力性能不足引发安全事故。因此,胶轮车的动力性检测是保障井下辅助运输安全的重要环节。但是,现有底盘测功系统对矿用胶轮车这类特种车辆的检测精度无法达到煤矿安全要求。为解决这一问题,本文综合运用理论分析、数值模拟和试验的方法,对矿用胶轮车底盘测功系统展开研究。首先,通过对胶轮车在巷道内的行驶阻力、底盘测功系统的台架阻力进行分析,得出胶轮车底盘最大输出
本研究针对肉牛高效养殖技术中的关键点,开展犊牛早期断奶和育肥期日粮配制技术研究。试验1以西门塔尔肉牛犊牛和母牛为研究对象,探讨了早期断奶对犊牛和母牛的生长性能及母
通风系统是保障矿井安全生产的关键,任何矿井均需时刻保持有风流在对应的通风回路中流动。即使在通风系统因故障或定期检修需进行主通风机切换时,中断通风的时间不能超过10分钟,最好能实现不停风切换。风机切换过程是利用多扇风门的启闭配合实现的,设计合理的多风门结构,不仅可调节流入井下各工作面风流的方向和风量,而且能实现主通风机的不停风切换功能。然而,实际生产中经常出现因风门故障,特别是在北方冬季极易出现因风