基于深度学习框架的药物特性预测

来源 :兰州大学 | 被引量 : 0次 | 上传用户:flymummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前在药物发现的预测过程中,普遍存在预测成本高、预测结果不理想等问题,因此如何解决这类问题已成为研究热点之一。预测药物渗透性能是评价药物能否被良好吸收的关键,人工测定的过程中包含大量人工干预,而用于预测的数据模型中使用的数据集较小,这些因素易导致特征选择过程复杂及过拟合问题。对药物毒性的预测,虽然也采用了随机森林(RF)等机器学习模型,但同样存在计算成本较高等问题。神经网络是处理分类和回归问题的传统方法,近年来通过不断完善和更新,逐步克服算法本身的局限性,提升算法效率。其中,深度神经网络表现出了强大的自主学习能力,在各应用领域均取得了良好的预测结果。基于以上背景,本文运用深度神经网络学习方法,通过搭建深度神经网络框架,使用大型数据集,对药物渗透性能和毒性的预测进行研究。主要工作包括:(1)鉴于深度神经网络拥有更高的判别能力,使用UG-RNN分子编码方法,研究最优的UG-RNN网络结构;(2)提出一个基于深度神经网络的二分类模型,用于预测药物的渗透性能,并在实验部分将其与传统的线性判别式分析(LDA)、梯度提升树(GBT)方法进行对比,结果表明,该二分类模型在预测精度上优于对比模型;(3)基于深度学习架构,开发药物毒性的回归预测模型,在回归实验中构建多组数据集,并将最终实验结果与单层神经网络(NN)做比较,结果表明,该回归预测模型的学习性能和预测结果优于NN;(4)将深度神经网络框架与支持向量回归相结合,得到组合回归模型,并测试其性能,通过评价预测精度,表明集合深度的学习方法具有更强大的预测能力。实验部分中,本文采集大量数据,处理后得到8组数据集用于检测模型性能。其中药物吸收性能预测实验中,共有663种化合物,209个分子特征;药物毒性预测实验中,使用475组药物数据作为训练集,198组药物数据作为测试集。为提升算法性能,使用drop-out方法减轻过拟合问题,使用修正线性单元(ReLU)方法减缓梯度消失问题。通过对分类模型和回归模型的预测结果和性能进行讨论和对比分析,表明深度学习的预测结果优于之前其他的机器学习预测模型。
其他文献
国务院国有资产监督管理委员会主任李荣融日前在“中央企业负责人会议”上说,中国政府从去年下半年始采取的一系列调控措施逐步落实并已见成效。与上世纪90年代后进行的上两轮宏观调控相比,本次调控具有4个新的特点。  李荣融说,这次宏观调控是在中国经济处于新一轮发展机遇之始,经济生活中出现的不稳定、不健康因素后果还没有充分暴露的情况下采取的。本次调控一是带有预防性的主动调控,主要是针对部分行业投资和信贷增加
中国中小企业融资结构现状分析为了对中国中小企业的融资困境有所了解,我们有必要对现有中小企业融资结构有所了解.考虑到目前中国正规金融统计中很少有按照企业规模与贷款分
本次会议上,中共中央政治局委员、国务院副总理曾培炎指出,加快东北地区等老工业基地调整改造,是中国着眼于全面建设小康社会作出的一项重大战略决策.
澳大利亚科研人员最近研究出采用一种天然蛋白质使绵羊脱毛的新技术,称为“生物剪毛技术”。这种蛋白质现已由“生物技术剪毛公司”生产并投放市场。接受生物剪毛技术处理的绵
Al-Ti-B中间合金是铝制品行业用量最多的晶粒细化剂,而国内生产Al-5Ti-1B中间合金的技术实力相对较弱,主要体现在控制合金内部组织的能力较差,这将严重阻碍高品质铝制品的生
党的理论建设,是马列主义、毛泽东思想的建设。它是党的思想建设的根本,在整个党的建设中极为重要。理论建设的状况,直接反映全党马克思主义水平的高低,标志党的成熟程度。当前,认真加强党的理论建设,对于巩固整党成果,造就坚强的领导班子,发挥党的核心领导作用,保证经济改革的健康发展,有重大的现实意义。
中国手机市场是块诱人的蛋糕,中外通信厂商为此开足了马力展开激烈的份额之争.通过对这个市场的密切关注,我们发现,就在这些手机巨头热火朝天地打造第三代产品的时候,处在风
山西省朔州市细水煤矿2005年“3·19”事故是一起特别重大瓦斯爆炸事故.爆炸波及相邻的康家窑煤矿,造成72人死亡(细水煤矿52人,康家窑煤矿20人),直接经济损失2021.5万元。
【正】 中国人有过举世瞩目的科技成就。但是,为什么近代科技革命却没能在中国发生?为什么中华民族至今未能跻身于世界科技先进之行列?这些问题是当代学术界极为关注的热点。