基于理化性质与结构拓扑参数的Decoy分子产生算法及其应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:itfwfp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、信息技术、结构生物学和理论化学的发展,越来越多的虚拟筛选算法被开发。如何评估这些算法的优越性已经成为研究的热点。药物虚拟筛选算法的评估主要是指所开发的算法能否区分具有特定生物活性的分子(Actives)和不具有特定生物活性的分子(Inactives)。因此,评估药物设计算法的初始步骤就是准备基准数据集,包括活性分子和非活性分子。生物活性分子可以通过特定生物学手段测试得到,比如酶的抑制或激动实验、癌细胞的抑制实验及疾病相关动物实验测试等。然而,针对特定的测试体系,活性分子在科学文献报道较多,非活性分子被指为垃圾分子,而很少在科学文献中报道。由于非活性分子太少,这样就不利于基准数据集的构建。因此,如何产生理论非活性分子(Decoy分子)显得尤为重要。Decoy分子是指与实验活性化合物物理化学性质相似而结构不相似的理论非活性化合物。到目前为止,应用比较广泛的虚拟筛选算法评估基准数据集及产生Decoy分子算法包括DUD、DUD-E和DecoyFinder。DUD是最早开发的评估虚拟筛选算法的基准数据集,包含40个靶标及相应的活性化合物和非活性化合物,然而DUD基准数据集存在一些缺陷而不能很好的评估虚拟筛选算法,如靶标数量不足,单一靶标所含有的活性化合物和Decoy分子个数较少,Decoy分子之间的骨架多样性较低,用户不能自己产生除40个规定靶标之外的Decoy分子。DUD-E是DUD的改进版本,完善了DUD基准数据集的一些缺陷。DecoyFinder是一个本地可执行软件,可以用于特定靶标的Decoy分子的产生。然而,DUD-E与DecoyFinder构建Decoy分子的方法仍然都存在很大的不足。首先,当需要产生成百上千个Decoy分子时,两者的计算速度相对较慢;其次,DUD-E构建的数据库可用靶标数量有限(102个靶标),尽管用户可以产生Decoy分子,但一个活性分子只能产生不多于50个Decoy分子,且DUD-E的底层数据库只含有Zinc数据库,缺少其它数据库来源的,致使数据库化学空间和多样性不足,造成有些活性分子不能产生对应的Decoy分子,而DecoyFinder方法虽然可以灵活的产生多个Decoy分子,但该算法并没有考虑电荷影响,造成准确度不高;最后,随着靶标活性分子的增多,如何设计多样性活性分子集成为构建基准数据集的难点,而DUD-E和DecoyFinder都没有考虑到这个因素。基于上述分析,本研究开发出了一个准确、高速、大量产生Decoy分子的程序套件RApid Decoy Retriever(RADER),该方法能够快速产生更好的Decoy分子,用于基准数据集的构建,方便药物虚拟筛选算法的评估。本研究的主要内容包括:(1)第一章综述了计算机药物辅助设计及虚拟筛选、Decoy分子产生的原理、作用及相关研究进展;(2)第二章RADER算法的设计思路及其实现和RADER算法的评估及RADER web的实现与运用;(3)第三章RADER算法在构建PI3K-AKT-mTOR通路靶标基准数据集中的运用;(4)第四章对本研究进行了总结与展望。本研究成功地开发出了快速、准确、参数化、简单易用的产生Decoy分子的程序套件以及在线软件系统。RADER产生Decoy分子的速度比DecoyFinder快7?550倍。RADER,DUD,DUD-E和DecoyFinder构建基准数据集的两种分子对接方法(MOE-docking和Autodock Vina)的富集率,MOE-docking的EFmax,EF1和EF20的平均富集度分别为:35.2、36.1、36.4、37.0和8.5、10.4、11.7、10.7和2.6、2.5、3.2、2.8;Autodock Vina的EFmax,EF1和EF20的平均富集度分别为:35.1、36.1、36.4、36.5和5.2、5.8、8.8、8和2、2.1、2.5、2.8。结果显示,RADER算法靶标平均富集率数值基本都小于DUD,DUD-E和DecoyFinder,因而产生的Decoy分子更适合用来构建基准数据集。此外,本研究也基于RADER方法成功地构建了PI3K-AKT-mTOR通路靶标的基准数据集,方便科研人员直接使用。
其他文献
在2013年8月11日国务院发布的《关于加快发展节能降耗产业意见》中指出:资源环境制约是当前我国经济社会发展面临的突出矛盾。解决节能降耗问题,是扩内需、稳增长、调结构,打
根据理论与实践存在的差异,结合我省公路专业教学的特点,阐述理论与实践相结合,可取得 事半功倍的效果。
期刊
传统的大学英语教学忽视了课堂中文化背景知识的融入,不利于学生有效掌握英语语言和文化,任何一种语言都是某种文化的反映,仅仅学习某种语言而忽视学习这种语言所赖以存在的
水稻新品种"吉农大18号"是以组培7为母本,以93-14为父本进行有性杂交,经系谱法选育而成.3年吉林省区域试验产量结果比对照(通35)增产5.23%,1年生产试验产量比对照增产6.0%."
以φ2000mm×2500mm柔性接口钢承口管为例,介绍了该类管材的模具设计要点,立式芯模振动、管端碾压工艺技术,以及在工程中的应用.
本文指出了目前我国部分省市的管桩产品结构设计图集中存在的混凝土有效预压应力计算错误,结合管桩生产工艺特点,提出了先张法预应力混凝土管桩结构计算中钢筋预应力损失及混
湘钢在科学发展中,通过创新青年人才培养机制和活动方式,大力开发青年人才资源,不断优化青年人才成长环境,促进各类青年人才脱引而出,实现了青年与企业的共同发展。
介绍了异形法兰盘自动焊接装置设计方案,通过对手工焊接的分析和比较,定位面和定位方式的合理选择,夹紧力的精准计算,有效地解决了异形法兰盘自动焊接定位难题