基于图神经网络的分子性质与药物互作用预测方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:snowmansoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物发现过程从新药设计到上市后的临床监测包括数个阶段,周期长、代价大且可能在各个阶段以失败告终。人工智能可为该过程的诸多环节降本增效,进而提高结果质量。分子性质预测作为药物发现早期的基本任务之一,旨在尽早剔除性质与预期不符的分子,只允许最有价值的分子进入后续环节。药物被批准上市后,临床用药时不仅需要考虑药物自身的性质,还需考量药物间相互作用的对药物有效性和安全性的影响。由于药物分子自身结构以及药物之间的互作用关系天然地可以表示为图,图神经网络的兴起为药物发现领域带来了新机遇,但其在该领域的应用也面临挑战。本文基于图神经网络对药物发现领域的分子性质预测和药物互作用预测两个任务进行研究,主要贡献如下:(1)研究标签数据短缺和活性悬崖现象下的分子性质预测任务。在早期的化合物筛选中,分子标签获取代价高昂,带标签的数据稀缺。活性悬崖指一组结构相近的分子在某性质上差异巨大的现象。处理活性悬崖问题是提升分子性质预测模型精度的关键。针对标签数据短缺和活性悬崖的挑战,设计了GXFP算法来提升图神经网络模型在该任务上的表现。GXFP首先利用分子的描述符对分子进行聚类得到伪标签,再利用标签和伪标签构造样本三元组。每个三元组含一对构成活性悬崖的样本和一对需被找出共性的样本。GXFP在模型训练的优化目标上稍作调整,使得模型对这些样本的表征得到优化,从而让基于表征学习的方法在该任务上获得性能提升。真实的小型数据集上的测试结果证实,GXFP在不引入高昂代价的同时能有效改善基于图神经网络的模型在该任务上的精度。(2)研究面向化学药和生物药的药物互作用预测任务。药物相互作用识别对临床治疗和药物重定位至关重要。针对药物互作用预测的计算方法未考虑生物药且生物药本身建模困难的问题,提出了一种双视角异构图数据库的构建方法以及相应的基于图学习的多类型药物互作用事件预测模型CB-TIP,将生物药首次纳入药物互作用预测的范畴。该构图方法构建双视角异构图以综合利用药物的化学结构特性和已知的药物互作用,并基于药物通过与内源蛋白质结合而发挥作用的事实,引入内源蛋白质以丰富图的双视角信息。CB-TIP采用图神经网络方法为异构的两类药物提取双视角融合的稠密向量表示,用以预测某药物与另一药物结合发生特定事件的可能性。真实数据上的实验以及案例分析表明,所提出方案在该任务上性能优异、预测结果有意义。
其他文献
癌症是一种死亡率极高且病因高度复杂的疾病,其高复杂性主要表现在肿瘤微环境中癌细胞和相关表型改变的非恶性细胞的克隆多样性。尽管目前用于治疗癌症的大多数药物是针对特定群体而开发,然而癌症的高复杂性会导致特定群体中的个体对同一药物有不同的敏感度。在癌症研究领域,精准医疗力求准确预测对个体患者有益的治疗方式,以实现更为精确和有效的基因靶向治疗。利用人类基因组学测序技术分析个体患者的肿瘤遗传信息,以对抗癌药
学位
现在是万物互联的时代,模数转换器(Analog to Digital Converter,ADC)是模拟信号转换为数字信号处理的必要工具。ADC目前广泛应用于生理信号检测、电源系统控制、高速通信、汽车信号检测等场景。ADC根据使用场景不同,有不同的性能要求,需要不同的ADC架构来实现。逐次逼近型(Successive-Approximation-Register,SAR)ADC是常用的ADC架构之
学位
AC-DC变换器作为快充技术的核心,广泛应用于各类便携式电子设备的适配器中,大功率、高效率、小型化是当前AC-DC变换器发展的主要趋势。传统反激变换器由于结构简单、成本较低,广泛应用于100W以下的中小功率输出等级的适配器中,然而由于漏感能量的耗散与功率管的硬开关,传统反激变换器效率较低且难以适应更高频的应用场景。有源箝位反激变换器能够实现漏感能量的有效回收以及降低开关管的开关损耗,在更大的功率等
学位
深度卷积神经网络在计算机视觉各个领域都取得了日益提升的突破性进展,然而对于某些特定场景下的应用则仍然存在很多问题,比如隐私安全和硬件代价(包括算法框架中的数据存储和计算成本等),这些问题都对深度卷积神经网络在实际场景中的应用落地起到阻碍作用。在多目标检测领域,大量应用RGB数据的监控算法在光照不好的情况下性能会下降,同时还存在隐私泄漏风险。因此我们选择利用Depth图像进行研究,一方面可以更好地避
学位
随着数字经济的发展,构建智慧化供应链已经成为一种必然。本文在分析传统生鲜农产品供应链体系及其存在的问题基础上,提出数字化有利于生鲜农产品供应链降本增效,分别从生产体系、加工体系、销售体系以及冷链运营服务体系分析数字技术赋能农产品供应链的具体路径。
期刊
高能量密度锂离子电池的广泛应用,有效地缓解了储能压力,但日益增多的寿命终止的锂离子电池的高效处置和再利用已然成为一项紧迫而长期的战略任务,特别是经济价值较高的正极材料再生是当务之急。保留正极材料复合结构高附加值的直接再生技术开发具有巨大挑战,为了解决这一问题,本论文通过以下两个方面进行研究:(1)在长期循环过程中,层状氧化物的不可逆相变通常伴随着活性锂的损失,直接表现为容量的急剧下降。然而,要准确
学位
作为工业控制系统的重要设备,工业机械臂广泛地应用于医疗、航空、电子等领域。随着工业化和信息化的紧密结合,工业控制系统中各个设备间互联互通,开放性和灵活性大幅增加,在提高产品生产效率的同时也引入了新的安全威胁,其中工业机械臂由于信息安全防护措施薄弱,极易遭受面向硬件、软件和通信过程等攻击,因此研究工业机械臂的异常检测方法对于保障工业机械臂和工业控制系统平稳运行具有重要意义。近年来已有部分工作对机械臂
学位
绝缘栅双极型晶体管(Insulated Gate Bipolar Transistor,IGBT)作为最热门的功率半导体器件之一,被广泛应用于智能电网、航空航天、轨道交通和新能源汽车领域,获得了电力电子装置“CPU”的称号。随着IGBT的飞速发展和成熟,IGBT的栅极驱动技术也越来越受到关注和重视。由于IGBT的栅极存在较大的寄生电容,并且IGBT的导通电压相对较高,使用微控制单元(Microco
学位
随着音频硬件技术的进步,录音装置越来越普及,并且呈现出小型化、隐蔽化的趋势,在方便快捷地录制音频的同时也对隐私信息安全产生了巨大的威胁。例如录音笔这类具有高隐蔽性的小体积录音设备被广泛使用,人们可能在毫不知情的情况下被记录私密的谈话内容,从而泄漏个人隐私、商业情报甚至国家机密。由于隐藏录音设备通常难以发现,当下对防窃听技术的需求愈发迫切。为解决隐藏录音设备带来的隐私安全问题,本文围绕防窃听技术进行
学位
工艺设计组件(Process Design Kit,PDK)是包含晶圆代工厂(foundry)完整工艺制造信息的数据文件系统。PDK技术能将工艺信息直观、准确的传递给IC(Integrated Circuit)电路设计工程师,大大降低了电路设计行业的门槛,提升了电路设计的效率。因此,使用PDK技术协助IC电路开发的模式已成为当前芯片设计的主流方案。但随着集成电路产业的发展,对于PDK技术的需求空前
学位