基于深度学习的药物性质预测算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wangleisxh1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着诸如非典、禽流感、猪流感等新型疾病出现,开发针对于这些疾病的新型药物面临越来越多的挑战。药物的设计与开发是一件耗资巨大且效率低下的工作,当生物学研究发现某一特定分子可实现治疗活性时,发现的分子常常因为毒性,低活性和低溶解度等多种原因最终不能成为潜在的药物。近些年来,随着药代动力学的发展,传统药物筛选的效率也逐渐提高,然而,对一种新的具有潜在药用价值的化合物进行测试,需要进行活体检测和实验,耗费大量时间及成本。因此,当前迫切需要一种准确、高效以及低成本的方式来快速鉴别某一分子对生物是否有副作用,能不能成为潜在的药物。在过去的几年中,深度学习在计算机视觉,语音识别,自然语言处理取得了巨大的进展,自2012年的AlexNet开始,卷积神经网络(CNN)更是大放异彩。针对上述问题,本文使用了一种改进的图卷积神经网络(GCN),将其应用于药物性质的预测,取得了较好的效果。本文的具体工作内容如下:1.本文使用了一种基于图的卷积多项式改进的图卷积神经网络模型,相比之前的图卷积网络可以更好的学习SMILES(简化分子输入规范)格式分子的特征。改进的图卷积网络可以处理SMILES格式的分子结构,并通过基于图的两种特征(原子特征和结构特征)来学习复杂的分子特征。2.本文提出了一种提取分子的结构特征的方法。本文使用RDkit化学工具包,通过遍历分子中所有原子以及价键,生成分子的邻接矩阵和度的矩阵,并计算拉普拉斯矩阵,将拉普拉斯矩阵做为分子的结构特征。在学习结构特征的同时,对于分子中每个原子的特征,文中借鉴自然语言处理的思想,使用词向量进行表述。将SMILES格式的分子数据集,根据SMILES格式规范以及原子和基团的特点进行分词,然后使用Word2vec训练词向量,用于表征分子中每个原子的特征。同时,基于目前流行的预训练的思想,本文使用了大量的基于SMILES格式分子的数据集训练词向量,从而提高词向量的表征能力。3.本文将经过改进的图卷积神经网络结合词向量用于药物性质(ADMET特性,包括吸收、分布、代谢、排泄和毒性)的预测中,通过与传统方法的比较体现本文方法的有效性。
其他文献
目的本研究通过分别检测对照组及行急诊冠脉介入治疗(percutaneous coronary intervention,PCI)术的急性ST段抬高型心肌梗死(ST segment elevation myocardial infarction,ST
自上世纪70年代,石油危机的爆发促使能源安全逐渐上升到全球国家战略层面,能源安全已经成为国家安全的重要核心问题,其关系到一个国家国民经济正常运转,关系到一国安定和社会
本论文以大血藤(Sargentodoxa cuneata)和巴楚蘑菇(Helvella leucopus)为材料,利用各种分离填料和分离技术对其化学成分进行系统的分离研究,最后运用波谱分析方法确定了分离
由于沿江沿海地区城市轨道交通建设的大量需求,和软黏土地基在运营期出现的过大沉降,软黏土地基沉降控制是工程中亟待解决的关键问题。明确软黏土在动载作用下的变形特性和微
随着我国经济的持续发展,区域空间形态正发生着日新月异的变化,经济发展较快的城市不断带动影响着周边城市及乡镇的发展,都市圈的概念应运而生。都市圈的整体发展离不开交通
用户生成内容是指网络用户在网络平台上通过创造性或非创造性行为所生成的相应内容。Web2.0时代是用户生成内容的繁荣期。用户不仅可以创造属于自己的内容的东西,还可以分享给他人知晓。全国用户的参与行为也从原来的全国性上网行为转变为了全国性织网行为,也就是除了传统的点击浏览行为之外,用户还可以通过使用互联网,开拓属于自己的信息空间,并且做到共享信息、内容创作等行为。随着Web3.0时代的兴起,人人都可以
学位
本文以水平底板索波形钢腹板连续刚构桥为依托,利用Midas/Civil有限元程序建立了结构空间分析模型,从静、动力学方面分析其结构响应特点。在静力学方面,以波形钢腹板布置范围
近些年我国内河航运得到了不断地发展,内河水路交通在我国交通系统中扮演着越来越重要的角色。内河船舶交通量对于航道建设、船舶交通安全来说极为重要,但内河运输船舶存在着船型复杂、船舶尺度多样等特点,对于内河船舶交通量的统计,不能仅仅是船舶数量上的统计,因为不同尺度的船舶所占用的航道空间不同,只有科学地对内河船舶交通量进行统计,才能反映航道的通航能力和船舶交通安全情况,才能更到的服务于内河航运。对于内河船
随着西部高速公路的快速发展,山区由于高填深挖诱发大量的大型和特大型工程滑坡,工程治理的难度和费用逐年增加,且传统单排或多排桩墙也无法满足很多工程对变形和稳定性的要
研究背景:脑胶质瘤是神经外科最常见的恶性肿瘤,治疗效果差,易复发,死亡率高,尤其WHO IV级的胶质母细胞瘤(GBM)患者更是如此。胶质瘤具有增殖快,浸润生长,放化疗耐受等特性。