基于机器学习的集合分子对接虚拟筛选研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:healthborn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物设计是计算生物学研究的热门方向,考虑到计算机模拟的低成本、耗时少等优点,使用分子对接软件来模拟靶标蛋白与小分子之间的相互作用,已成为药物设计过程中的常见手段。已有的分子对接软件常采用多构象法来描述小分子柔性。但蛋白质柔性的处理是一个巨大挑战,当前最常见的处理方法是“系综对接”(或集合对接)。基于分子对接的虚拟筛选作为药物设计的辅助工具,有着非常重要的应用价值,如今这一技术已经变成了药物发现过程中不可或缺的一部分。目前我们需要解决的问题是如何从大量的构象中挑选出富集效果较好的蛋白质用于虚拟筛选。本文工作我们使用靶标蛋白的各个同源蛋白作为其初始构象集,设计实现了一个将分子对接与机器学习相结合的构象挑选方案。在本篇论文中,我们根据设计的方案挑选出富集效果较好的蛋白质,来区别活性配体分子与诱饵。首先,方案是以未知小分子为前提进行设计的。其次,方案设计基于计算机模拟分子对接,使用基于知识的打分函数评价分子间相互作用强弱,以计算得出的AUC值判定富集效果。针对上述问题,本研究使用了源自DUD数据库中的十组不同数据集,以每组蛋白质的apo结构作为模板,搜索同源序列相似度90%以上的蛋白质,根据RMSD大小进行聚类。通过MDock分子对接软件进行对接,对接后根据打分函数计算不同蛋白质构象的富集率与AUC值,挑选富集效果较好的同源蛋白。最后,我们再利用机器学习算法挑选富集效果较好的同源蛋白,这是一种结合靶标蛋白局部特征来挑选同源蛋白的算法,提取原子和残基水平特征作为随机森林算法的输入,用Grid Search CV搜索最佳参数以及进行五倍交叉验证,根据输出每个同源蛋白AUC的预测值进行排名。根据测试的结果表明,我们的算法在挑选同源蛋白top1、top3、top5上成功率比较高。
其他文献
将超临界CO2布雷顿循环应用于太阳能热发电技术,可进一步提高介质温度、改善发电效率。超临界CO2太阳能吸热器是超临界CO2太阳能热发电系统的关键设备。为研究超临界CO2太阳能吸热器的传热性能,本文设计并搭建了一套超临界CO2聚光集热实验系统,并对实验系统的性能进行了模拟分析。根据腔式吸热器的运行参数要求,以及现有的碟式聚光镜实验台结构参数,本文设计了超临界CO2聚光集热实验系统的详细方案,进行了关
目的:了解武汉市儿童注意缺陷多动障碍(Attention deficit hyperactivity disorder,ADHD)症状特征和邻苯二甲酸酯类(Phthalate esters,PAEs)代谢物的暴露水平,研究代谢物暴露水平、BDNF(Brain-derived neurotrophic factor,BDNF)基因多态性及其交互作用与儿童ADHD发生的关联性。探讨ADHD的发病机制及
癌症是世界范围内的重大公共卫生问题,已经严重威胁到人类的生命安全。根据2020年的全球癌症统计,肺癌发病率在恶性肿瘤中位居第二,在因癌症死亡的病因中位居第一。其中,非小细胞肺癌(Non-small cell lung cancer,NSCLC)约占所有肺癌病例的85%,其5年生存率极低,几十年来一直没有得到提高。在目前有效的治疗手段中,化疗仍然是晚期NSCLC的标准一线治疗方法。由于病人对化疗药物
多智能体系统协同控制的研究不仅有助于揭露生物集群行为的内部机制,而且有助于解决诸如无人机编队、智能电网和交通网络等实际应用问题。二阶动力学模型由于包含个体的位置项和速度项,因而能更好的反映出现实生活中个体的运动特性,从而使得二阶多智能体系统成为越来越多研究人员研究的焦点问题。另外,切换行为不仅会发生于系统的网络拓扑中,而且还会发生于个体的动力学行为中,故而切换多智能体系统的二阶一致性问题亟待被研究
带电粒子与二维自由电子气相互作用是表面物理学中的重要研究内容,也是典型的等离子物理、固体物理和核物理领域的交叉课题。随着现代微电子技术的快速发展,研究固体表面的性质显得越来越重要。带电粒子与二维自由电子气相互作用的研究在材料表面的镀膜、刻蚀和改性方面以及半导体、集成电路的大规模生产方面具有重要的应用。除此之外,在研究物质表面的性质方面,利用入射的带电粒子作为探针来探测物质表面的性质也是带电粒子与二
SIPA1蛋白(signal-induced proliferation-associated protein 1)是一种丝裂原诱导的GTPase激活蛋白,研究表明SIPA1蛋白参与多种恶性肿瘤的发生和转移,并且发现在恶性乳腺癌细胞中定位于细胞核,与DNA相互作用,调节integrinβ1/CD44等基因启动子的转录活性,从而影响细胞迁移/干细胞性,提示核定位的SIPA1蛋白能与DNA结合,可能起
研究背景和目的:血管硬化是心血管疾病的潜在危险因素,与吸烟密切相关。环氧-二十碳三烯酸(Epoxyeicosatrienoic acids,EETs)对心血管疾病有保护作用,但是易被可溶性表氧化物水解酶(Soluble epoxide hydrolase,s EH)代谢为没有生物活性的二醇。以前的研究发现,EETs具有抑制血管重构的作用,然而s EH敲除能否改善尼古丁导致的血管硬化目前未见报道。因
极化码(Polar Codes)是第一类被理论证明达到信道容量的编解码方案,自提出以来就备受关注。连续相消列表(Successive Cancellation List,SCL)译码算法,可以有效抑制连续相消(Successive Cancellation,SC)译码算法中的错误传播现象,提升中短码长下的纠错性能,是目前应用最为广泛的极化码译码算法之一。现有的极化码SCL译码器硬件实现多为列表并行
带内全双工(In-Band Full-Duplex,简称IBFD)技术具有在不额外增加频谱的前提下,实现频谱效率翻倍的潜力。这在频谱资源日益稀缺、且频谱效率的基数已然较高的今天,尤其具有吸引力。全双工技术所面临的最大挑战在于克服非常强的自干扰:以典型Wi-Fi系统为例,其自干扰相对背景噪声的功率差异高达110d B。为了不影响系统接收机的性能,这就要求将自干扰功率至少降低110d B。考虑到自干扰
日渐严重的致病微生物传播问题引起研究者的广泛关注,因此研发新型的抗菌剂势在必行且大有可为。纳米过氧化镁(Nano-Mg O2)作为一种生物相容性好、无毒害的金属过氧化物,在抗菌领域具备巨大的应用潜力。本文采用不同的工艺方法制备纳米过氧化镁,研究其抗菌性能,并通过复合改性的方式制备银/过氧化镁纳米复合物,旨在进一步提升纳米过氧化镁的抗菌性能。主要研究结果如下:(1)采用两种典型的工艺方法制备纳米过氧