基于深度协同过滤算法的药物重定位研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:jiayunhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物重定位指的是挖掘已有药物的新治疗作用,已经成为药物设计的重要研究领域。药物重定位的有效途径是预测药物和靶标的相互作用(Drug-Target Interaction,DTI)。仅依靠生物实验进行药物和靶标关系识别,难以在大量药物、靶标中找到有效的药物-靶标对。基于矩阵分解的协同过滤技术在药物-靶标关系预测领域取得了不错的成果。但是仍然存在不足之处:首先,先前矩阵分解方法不能有效利用标签信息和无标签信息,因此如何有效学习数据是亟待解决的问题。其次,药物和靶标的相互作用矩阵非常稀疏,对矩阵分解的准确性极易造成影响。为克服上述困难,提高药物-靶标关系预测的效果,主要工作和创新如下:针对矩阵分解无法有效学习数据信息的问题,提出半监督图正则化矩阵分解(Semi-Supervised Graph Regularization Matrix Factorization,SSGRMF)算法。首先为了学习有限的药物标签信息,引入标签矩阵改进无监督的非负矩阵分解,构造半监督矩阵分解模型。然后为了学习药物数据和靶标数据的局部几何结构,采用药物图正则化和靶标图正则化,使分解过程中原始空间中彼此接近的药物或靶标在学习的流形中同样彼此接近。最后,根据药物、靶标图正则化和标签约束扩展非负矩阵分解模型,进行药物-靶标关系预测。为评估模型的性能,在yamanishi数据集上进行对比实验,与对比的两种矩阵分解方法相比SSGRMF取得最高AUC和AUPR值,结果表明SSGRMF算法在标签数据有限的情况下可以有效学习数据的特征,在DTI预测上性能更优。针对DTI矩阵稀疏的问题,将辅助深度自动编码器引入SSGRMF算法中,提出深度协同过滤(Deep Collaborative Filtering,DCF)算法。首先为了利用药物、靶标原始结构信息,设计一种并行输入的辅助深度自动编码器,用于同时提取DTI矩阵和药物、靶标的潜在特征。然后将辅助深度自动编码器融入SSGRMF中,训练模型求解最优的药物潜在影响因子和靶标潜在影响因子。最后通过矩阵补全预测出可能发生反应的药物-靶标对。为了验证模型,将深度协同过滤算法在增加药物、靶标特征的yamanishi数据集上进行实验,对比最新的两种DTI预测方法有更优秀的效果。证明本文算法能够缓解DTI矩阵稀疏问题,提高DTI预测准确性。并且将推荐的前十名药物-靶标对,与公开数据库比对,结果有70%的药物-靶标对得到了认证,证明本文方法在药物重定位中的可行性。
其他文献
世界的繁荣与发展离不开能源。面对能源需求对资源和环境的挑战,构建清洁低碳、安全高效的能源体系已成为科技发展的焦点。低碳醇不仅可作为传统燃料的替代品,而且广泛应用于精细化工产品等。随着以煤炭为原料的C1化工逐渐受到重视,利用CO加氢制取低碳醇的工艺在燃料化工领域的价值日益凸显。迄今为止,催化系统仍存在众多难题,实现工业化任重道远。CuFe基催化剂因其价格低廉、稳定性高、反应条件温和、操作温度范围较广
聚丙烯腈(PAN)基碳纤维具有高比强度、高比模量、耐高温、耐腐蚀、密度低等一系列优异性能,既含有碳材料的固有属性,又兼具纤维材料的柔软性和可加工性,是制备高性能复合材料
煤层气是在煤开采过程中附带的一种高效清洁的能源,别名又称为“瓦斯”。我国的煤层气资源分布范围特别广,资源也十分丰富。在开采煤层气时,需要对煤储层进行调查,包括抽采煤层气的机理、钻井技术以及获取煤储层关键参数。试井技术是获取煤储层关键参数的重要手段。因此,本文结合山西省煤炭地质局实用性生产技术及创新项目“煤层气注入/压降试井地面控制监测系统研发,项目编号为2017-5”对试井技术开展研究工作。煤层气
作为新一代信息技术的重要组成部分,物联网旨在无所不在地部署传感器节点以实现大规模物联网应用。近年来,自身不配备电源设备的无源感知标签的兴起加速了物联网技术的发展。无源感知标签从周围环境的射频信号中获取能量以支持其计算、感知、存储和通信与组网等操作。其中,可计算射频识别平台因其体积小、无源、低功耗和永久感测的潜力备受学术界和工业界关注。为了满足大规模物联网应用的实时性和可靠性需求,如何有效地提高无源
本文主要对两类浅水波方程的解进行定性研究.第一章,主要介绍Holm-Staley b族方程以及一类5阶Camassa-Holm模型(我们将其简称为FOCH模型)相关问题的研究背景和研究现状,并给出
随着社会经济和科学技术的不断发展,能源和环境问题成为人类社会发展过程中必须面对的问题。超级电容器作为一种新型环保储能设备,其能量密度大于传统电容器,而功率密度大于电池,在能源领域具有巨大的市场潜力。对于超级电容器而言,电极材料是决定其性能优劣的关键,因此,找到高性能的电极材料成为了现在研究的热点。在各种电极材料中,聚吡咯(PPy)以其合成简易,性能良好,价格低廉,对环境友好受到了广泛的关注。而聚吡
猕猴大脑与人脑结构较为相似,某些高级功能例如视觉系统也与人相似,因此人们可以通过研究猕猴大脑来了解人脑的某些作用机制。此外,通过比较猕猴大脑和人脑结构的不同来进行跨物种比较也可以揭示更多进化方面的奥秘。对猕猴大脑进行研究的手段主要为对采集的MRI图像进行分析。其中皮下核团的分割最为困难,也最为重要。目前皮下核团的分割主要借助人脑MRI分析软件进行分割,然后再人工修改完善,关于猕猴的自动分割方法较少
近年来,受气候变暖、大气污染以及能源短缺等世界性问题的影响,各国纷纷出台政策支持新能源汽车产业发展,寻求代替传统内燃机车的有效途径。其中,纯电动汽车因其零排放、高效
随着我国社会的不断进步,国内经济也得到了高速发展,我国城市建筑规模不断扩大,而建筑也越来越高,建筑火灾也是屡有发生,因此,火灾自动报警系统被广泛用于建筑物中的预防火灾
乳腺癌是严重威胁女性健康的恶性肿瘤之一,及早地发现与诊断对乳腺癌的防治有着至关重要的作用。随着医学图像处理技术的发展与应用,利用自动分析方法对乳腺肿瘤图像进行定量分析和分割识别已成为现代医疗诊断的一种重要辅助手段。计算机辅助诊断弥补了人工检测中存在的误差大、效率低等缺点,为医学专家提供了更为直观和精确的判断依据,对相关疾病的研究具有重要的应用价值。本文主要从乳腺肿瘤图像的分割与分类两方面展开深入研