【摘 要】
:
探索药物-靶标的相互作用是药物重定位的关键步骤,而生物实验的鉴定方法不仅耗时与费力,风险也很高。因此,使用计算学的方法来预测药物的可能靶点,为生物鉴定实验提供可靠的药物-靶标候选,可以有效的减少鉴定试验的工作量,从而提高药物研发的效率。如何准确的预测药物与靶标之间潜在的相互作用,是一项挑战性的课题。本文提出了一种网络表征学习算法——基于自动编码器的相似性整合算法(简称AESF),与两种面向异构网络
论文部分内容阅读
探索药物-靶标的相互作用是药物重定位的关键步骤,而生物实验的鉴定方法不仅耗时与费力,风险也很高。因此,使用计算学的方法来预测药物的可能靶点,为生物鉴定实验提供可靠的药物-靶标候选,可以有效的减少鉴定试验的工作量,从而提高药物研发的效率。如何准确的预测药物与靶标之间潜在的相互作用,是一项挑战性的课题。本文提出了一种网络表征学习算法——基于自动编码器的相似性整合算法(简称AESF),与两种面向异构网络的预测模型——基于梯度提升决策树的预测模型(简称DTIGBDT)与基于对抗型的图卷积编码器的预测模型(简称GANDTI)。AESF使用自动编码器整合了多种药物相关数据和靶标相关数据——包括四种药物相似性与三种靶标相似性。实验表明,AESF可以为之后的药物-靶标相互作用的预测模型提供更可靠的数据输入,从而得到更准确的预测效果。DTIGBDT是一种基于梯度提升决策树的集成学习方法。在本文所使用的数据集中,已知的药物-靶标相互作用(正例)与未知的相互作用(反例)之间存在着严重的类别不平衡现象,这种类别间的不平衡可能会对预测的结果产生不良的影响。DTIGBDT通过使用集成学习模型——梯度提升决策树,在充分的利用数据集中的反例信息的同时,有效的减轻了类别不平衡现象对预测结果的消极影响。该方法为提取的药物-靶标特征向量构建多棵决策树,并通过综合考虑各棵决策树的预测结果得到最后的预测评分。实验表明,DTIGBDT的性能显著优于几个现有的表现最良好的药物-靶标相互作用预测方法。另外,在Quetiapine,Clozapine,Olanzapine,Aripiprazole和Ziprasidone五种药物上的案例分析也证明了DTIGBDT具有发现潜在的药物-靶标相互作用的能力。GANDTI是一种基于对抗型图卷积编码器的预测方法。图卷积编码器可以通过深度整合药物-靶标异构网络中的拓扑信息与节点属性来学习到药物与靶标节点在低维向量空间中的特征表示。生成对抗网络结构则通过调整这些特征向量在低维空间中的特征分布来提高编码质量。之后,基于集成学习模型Light GBM的分类器可以充分的利用数据集中的所有负例。与其他药物-靶标相互作用的预测模型相比,GANDTI的预测结果更为准确。案例分析也近一步的证明了GANDTI可以有效的预测药物的可能靶标。
其他文献
云计算是一种新型的计算存储方式,用户不需要掌握专业的技能,只要按照自己的需求付费就可以享受便捷的网络服务。我们在使用云服务时,需要将数据上传到云服务器。在这个过程中,我们不可避免地面临着数据安全的挑战,如何保证云环境下数据的隐私安全成为了亟待解决的问题。云环境下数据安全隐私保护主要分为两方面,一方面对外保护数据的隐私;另一方面对内保证数据的完整。身份认证是云服务安全的第一道防线,可以有效地防止非法
随着教育信息化水平的不断提高,计算机辅助语言学习(CALL)系统在语言教学中的应用也变得更加广泛。在国内大学的英语口语考试中,教师需要对大量考生的口语录音进行人工批改,这是一项重复且消耗时间的工作。利用CALL系统实现对口语录音的自动化批改将能减轻教师的工作负担。目前这样的系统已经成功实现了对朗读型口语题的自动批改。然而,针对开放式口语题型进行自动化批改仍然是待突破的研究重点。因此,设计并实现一个
改革开放40多年以来,随着我国社会主义市场经济体系不断完善,各个行业中的现代企业制度日趋成熟。我国企业的市场份额也因此逐步显现,国内外市场地位也逐步确立。面对激烈的
量子信息科学是一门包括量子光学、量子力学等多种学科的新兴交叉学科。最近,随着人类科学技术的发展和技术水平的上升,众多理论方案在实际实践中得以实现,例如量子隐形传输、量子密集编码和量子密钥传输等。其中自1993年量子隐形传态理论方案有Bennet等人做了开创性工作以来,就引起了广大理论物理学家和实验物理学家的关注,量子隐形传态是通过局域操作和分割两地的两种纠缠粒子将不可知的粒子态以高于任何经典协议的
共情是一种人与生俱来的能力,它能够帮助我们理解和感应他人的情绪情感。共情法作为心理咨询方面的一种有效方法,正在被各个领域加以应用。将共情方法引入到历史教育领域,一方面可以在师生之间建立起一座情感共鸣的桥梁,有利于增进师生之间的沟通、理解和关怀,建立良好的师生关系;另一方面,师生通过共情于历史,可以站在前人的角度审视历史发展的轨迹,对历史的发展和演进产生更深层次的理解和更高层次的感悟,深入发掘历史的
随着互联网技术的快速发展和广泛应用,信息安全的重要性日益凸显。现代密码学是保护信息安全的重要理论基础。密钥交换协议是现代密码学最基础的密码学原语之一,能够在开放的信道上使通信双方达成密钥共识,进而进行保密通信。密钥交换协议在互联网协议、电子商务、保密通信等领域已经得到了极为广泛的应用。随着量子计算机的快速发展和量子算法的提出,基于传统数论困难问题的密钥交换协议开始面临挑战。因此,尽快部署和应用抗量
思维决定态度,态度影响行为,在这个关系链中思维方式是影响行为变化的起点。创新行为亦不例外。以往从个体视角对员工创新行为进行的研究多集中于员工的特质和动机等外显角度
由于Web2.0时代的到来,互联网从信息共享时代步入了信息共建时代,网络新闻的迅速发展极大的改变了人们在生活中获取新闻信息的媒介和习惯。在大数据时代的今天,我们要对互联网上日益递增的新闻数据进行高效率的全网检索常常都会因其海量、高复杂性、非结构性的特点而受阻。为了提升用户与互联网之间的互动体验,实现更高质量检索,最终实现能够预测出互联网用户所需信息的目的,知识图谱便应运而生。本文在爬取到的网络新闻
随着目前信息技术的不断发展,数字图像已成为人类获取外部信息的一种重要途径,目前在日常生活时,人类收集图像的条件往往不是很理想,在类如雨天雪天或者大雾的恶劣外部环境中,就会收集到无法清晰表达信息的图像,而且如果拍摄水平较低或者拍摄机器较差,也会使收集到的图像难以使用。这类图像往往拥有平均亮度较低,细节模糊,信噪比较大等特性被称为微光图像,微光图像必须要通过图像增强处理来达到日常生活或科研要求。Ret
随着以比特币为代表的数字货币的兴起,区块链以去中心化、去信任、不可篡改和不可伪造等优势受到了广泛关注,区块链应用和研究呈现爆炸式增长,其应用已从数字货币扩展到金融、贸易、物联网和供应链等行业。一方面,区块链技术为传统行业的发展带来机遇,区块链可以安全透明地跟踪存储在区块中的数据,并可以有效地保证每个参与节点存储的数据的准确性和一致性,区块链和传统行业的结合可以很容易解决传统行业的中心化所带来的的问