基于有监督的多视角图神经网络的药物协同预测算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:sinking521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联合用药对复杂疾病的治疗具有非常重要的应用价值。通过药物组合治疗,可以提高临床治疗效果,减少药物的副作用,甚至可以帮助病人克服耐药性。近年来,联合疗法被研究人员应用到癌症治疗中,已经成为现代癌症治疗中不可或缺的一种治疗手段。在生物学中,研究人员凭借着先验的生物知识与临床经验,通过生物实验筛选方法来确定有效的药物组合。虽然传统的实验筛选方法已经有效地发现一批药物组合,但是随着大量新药被研发出来,药物组合的搜索空间变得越来越大,通过实验筛选出所有可能的药物组合在实践中变得不可行,因此迫切需要开发更多有效的计算方法来预测新的药物组合。最近,各种机器学习方法被提出来计算预测协同药物组合。为了预测特定细胞系中的药物协同作用,现有的机器学习算法通常将三种特征(即两种药物的特征和给定细胞系的特征)进行串联并输入至各种机器学习模型中进行预测。然而,现有的算法普遍存在以下挑战:首先,癌症治疗总是在起源组织上发现的,同一组织中不同细胞系之间是相似的,而现有方法没有考虑利用不同细胞系之间的信息传递来提高模型的预测效率。其次,已知的药物组合可以构建为一个图,其中节点是药物,边表示不同药物之间的协同效应。而目前各种基于机器学习的方法没有考虑将药物-药物协同图结构数据用于药物协同预测,缺乏有效的药物互相作用建模方法。为了解决以上挑战,本文提出了两种基于有监督的多视角图神经网络框架的药物协同预测算法。这两种算法可以为药物协同预测学习到一个更可靠的药物隐藏表示。本文主要介绍了两个模型框架,分别为:(i)基于变分图自编码器的多视角图神经网络框架,称为GNNSynergy-V。针对特定的肿瘤细胞系,该框架将当前预测的细胞系作为主视角,而同一组织中的其他细胞系作为子视角。在每个视角中,首先构建一个药物-药物协同图来描述不同类型的药物协同效应,并采用变分图自编码器来学习特定细胞系的药物隐藏表示;然后,通过多视角框架进一步整合主视角和其他子视角的药物信息,提升药物表示向量的可靠性;最后通过引入已知的药物组合得分作为监督信号对模型进行监督训练,实现可靠的药物协同效果预测。(ii)结合注意力机制的多视角图神经网络框架,称为GNNSynergy。该框架将注意力机制引入至GNNSynergy-V中,实现了一个结合注意力机制的改进算法。不同于GNNSynergy-V,GNNSynergy考虑了不同子视角与主视角之间信息的权重不同,因此,在聚合多个子视角的药物信息时,引入了注意力机制来为不同子视角分配权重,从而使得主视角最终的药物隐藏表示更具有鲁棒性。另外,为了减少模型的复杂度,GNNSynergy使用了图卷积神经网络作为编码器进行药物特征的提取。为了验证本文算法的有效性,我们在Drug Comb数据集上将本文所提出的算法与基线方法进行了对比实验,实验结果表明,GNNSynergy-V和GNNSynergy在协同药物组合预测中,在均方误差、平方根误差、绝对误差以及皮尔逊相关系数和斯皮尔德曼相关系数上显著优于所有的基线方法。通过消融实验和参数敏感度分析,证明了本文算法的框架结构的合理性。通过预测案例分析,验证了本文算法在实际临床中的实用性。总的来说,本文提出了两个针对药物组合协同预测的有监督的多视角图神经网络框架,分别称作GNNSynergy-V和GNNSynergy,它们通过整合同一组织内其他类似的细胞系的数据提高药物协同得分预测的准确度。同时,本文所提出的GNNSynergy-V和GNNSynergy是首个将多视角预测和图神经网络引入到药物协同组合预测的工作。实验结果证明,GNNSynergy-V和GNNSynergy具有一定的先进性。
其他文献
思维导图是一种图形思维工具。思维导图具有图文兼备的特点,能够最大限度地将学生的思维外化,利于学生形象地学习新知与整合加工信息。思维导图的形式多样,学生可根据自身思维特点及认知规律加以应用,从而有效提高课堂学习效率。将思维导图应用到小学语文课堂教学中,能够有效激发学生的课堂兴趣,充分训练学生的思维品质,使学生在识字、阅读及写作过程中主动参与学习并高效构建知识体系,从而实现语文素养的内化。
期刊
随着化石能源日渐枯竭,世界各国对清洁能源的需求和探索也越来越急切。由于风资源的易获得和可再生特性,研究风力发电对落实国家能源政策、节省化石能源消耗等方面具有重大意义。然而风力发电具有较强的随机性,一定程度的波动性以及间歇性等不稳定特征,容易给电网系统的安全稳定运行造成冲击。因此,为了保障电力系统的安全性、经济性,我们需要开展针对风电功率预测的进一步研究工作,针对现有的预测工作做出改进,提高预测模型
学位
在互联网的发展历史中,由各类技术标准支撑实现了传统网络架构,传统网络架构在当前的网络体系中占有重要地位,其层次结构为网络通信带来巨大变革,但是随着网络流量的急速增长与用户需求的多元发展,面对各种定制化服务需求,传统网络暴露的不足越来越多,其封闭的网络设备内置了过多的复杂协议,增加了运营商定制优化网络的难度。为此软件定义网络成为了网络架构新的技术发展方向。本文基于软件定义网络架构,针对军网通信场景,
学位
深度学习作为实现人工智能的关键技术已经被广泛应用于生活和工业中的各个领域。分布式训练是加速深度学习模型训练的常用方式,可以有效地应对深度学习面临的大模型和大数据挑战。然而,分布式训练中的参数同步导致了严重的通信瓶颈问题,阻碍了分布式训练规模的拓展和训练速度的提升。现有的研究大多从减少通信频率或压缩通信的数据量进行考虑,但这些方法都需要复杂的超参数调整,并会造成一定程度的模型精度损失。本文研究了深度
学位
因果关系的学习有助于我们理解数据背后的生成机制及回答“为什么”等问题,它被广泛应用在生物,医学,社会科学等领域。然而传统的因果关系学习方法大都是基于干预(interventions)或者随机实验(randomized experiments),这使得在现实应用中,往往需要较高的成本代价,或者是不道德的。如何仅从观测数据中挖掘背后的因果关系,也称因果结构学习,成为更加普适的研究方法。函数因果模型(F
学位
单光子发射计算机断层扫描(SPECT)是一种非侵入型的分子成像技术,在肿瘤和心血管成像等领域中发挥了重要作用。该技术在患者体外设有环绕旋转的探测单元,探测单元接收患者体内引入的放射性示踪剂衰变时所发射的高能光子,将光子在探测单元上的投影重建为对示踪剂分布的估计,利用不同组织间放射性活性的差异获取组织器官的生化信息。这些信息的变化往往早于宏观结构的改变,因此对某些疾病的早期发现和诊断具有优势。由发射
学位
路径规划(Path Planning)是智能机器人领域的重点研究方向之一,它与轨迹生成(Trajectory Generation)共同组成了运动规划的主要内容。其中,路径规划关注的是机器人在环境已知或未知的情况下,静态或者实时地规划出一条从起点到终点的无障碍碰撞路径。这类算法优劣的评判标准一般分为规划时间、路径长度两个方面,用更快的时间规划出一条最短路径是路径规划研究的主要目标。目前,静态环境下
学位
在大数据时代,知识图谱成为表示和组织海量知识的一种重要形式。其中,知识图谱的新探索领域是分布式知识表示学习,它主要研究在低维空间中如何表示知识图谱的关系与实体,同时捕捉其语义信息。但是,实体稀疏性常见于知识图谱,导致现有的分布式知识表示学习方法难以正确地学习到稀疏实体的向量表示,从而影响知识图谱的应用效果,为此,本文开展了以下工作:(1)提出一种捕获稀疏实体特征的激活机制,用于优化知识表示学习模型
学位
启发式搜索作为智能规划问题求解的重要范式之一,其性能主要取决于启发式估值函数的信息度和启发式搜索算法的效率。FF规划器的放宽规划图启发式、Fast-Downward规划器的因果图启发式、LAMA规划器的7)8)(8启发式等精心设计的领域无关启发式,都表现出了优异的求解性能。然而,不同的启发式具有不同的结构特征,代表了不同的设计策略。一方面,单一启发式并不能完美适用于所有规划问题。另一方面,预先设计
学位
掺铥光纤激光器(Thulium-Doped Fiber Laser,TDFL)输出功率的持续增长以及应用范围的不断拓展,其输出激光的功率稳定性要求也越来越严格。TDFL长时间工作时会因为光子暗化效应(Photon Darkening Effect,PD)的影响而导致输出功率慢慢下降,稳定性变差,温度升高等情况,严重影响了稀土掺杂激光器的持续发展。本论文以目前的光子暗化研究为基础,对掺铥光纤激光器的
学位