论文部分内容阅读
目前在药物发现的预测过程中,普遍存在预测成本高、预测结果不理想等问题,因此如何解决这类问题已成为研究热点之一。预测药物渗透性能是评价药物能否被良好吸收的关键,人工测定的过程中包含大量人工干预,而用于预测的数据模型中使用的数据集较小,这些因素易导致特征选择过程复杂及过拟合问题。对药物毒性的预测,虽然也采用了随机森林(RF)等机器学习模型,但同样存在计算成本较高等问题。神经网络是处理分类和回归问题的传统方法,近年来通过不断完善和更新,逐步克服算法本身的局限性,提升算法效率。其中,深度神经网络表现出了强大的自主学习能力,在各应用领域均取得了良好的预测结果。基于以上背景,本文运用深度神经网络学习方法,通过搭建深度神经网络框架,使用大型数据集,对药物渗透性能和毒性的预测进行研究。主要工作包括:(1)鉴于深度神经网络拥有更高的判别能力,使用UG-RNN分子编码方法,研究最优的UG-RNN网络结构;(2)提出一个基于深度神经网络的二分类模型,用于预测药物的渗透性能,并在实验部分将其与传统的线性判别式分析(LDA)、梯度提升树(GBT)方法进行对比,结果表明,该二分类模型在预测精度上优于对比模型;(3)基于深度学习架构,开发药物毒性的回归预测模型,在回归实验中构建多组数据集,并将最终实验结果与单层神经网络(NN)做比较,结果表明,该回归预测模型的学习性能和预测结果优于NN;(4)将深度神经网络框架与支持向量回归相结合,得到组合回归模型,并测试其性能,通过评价预测精度,表明集合深度的学习方法具有更强大的预测能力。实验部分中,本文采集大量数据,处理后得到8组数据集用于检测模型性能。其中药物吸收性能预测实验中,共有663种化合物,209个分子特征;药物毒性预测实验中,使用475组药物数据作为训练集,198组药物数据作为测试集。为提升算法性能,使用drop-out方法减轻过拟合问题,使用修正线性单元(ReLU)方法减缓梯度消失问题。通过对分类模型和回归模型的预测结果和性能进行讨论和对比分析,表明深度学习的预测结果优于之前其他的机器学习预测模型。