基于多种相似性融合的药物重定位研究与应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lzl2008000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今的药物研发工作所消耗的人力物力、时间和资金都变得越来越多,并且每年的申报名额也在逐年减少,药物研发工作变得越来越难以开展。得益于前人的科研工作经验的总结和大数据化的数据交流的发展,人们逐渐倾向于寻找一种成本低、效率高的方法应用于药物的研发初期,为现有药物提供高置信度区间的潜在适应症,这种技术被称为药物重定位。虽然目前已有不少科研人员提出了极具研究价值的预测模型,然而,在药物相似性和疾病相似性的全面挖掘和科学利用等方面的技术,目前大多数药物重定位方法仍然缺乏。为了解决这些问题,本文提出了两个模型分别对其进行了探究,具体研究内容如下:(1)基于多重相似度挖掘的药物-疾病关联预测二分图扩散算法(BGMSDDA):第一步,采用加权K近邻(weighted K nearest known neighbors,WKNKN)算法重建药物-疾病关联矩阵;第二步,设计了一种融合线性邻域相似度和高斯核相似度的药物和疾病相似特征提取方法;第三步,使用二分图扩散算法来推断尚未发现的药物与疾病的关联。经过10次交叉验证实验,BGMSDDA在两个数据集上均表现出良好的性能,AUC分别为0.939±0.001(Fdataset)和0.954±0.001(Cdataset),AUPR分别为0.466±0.001(Fdataset)和0.565±0.001(Cdataset)。此外,为了评价BGMSDDA预测结果的准确性,我们从Fdataset和Cdataset中分别选取三种医用药物进行了案例研究,并利用一些数据库对每种药物的预测相关疾病进行了验证。基于所获得的结果,BGMSDDA被证明在预测药物-疾病相关性方面是有用的。(2)基于中心核对称多核学习的药物-疾病关联预测的压缩感知算法(DRPADC):第一步,对于原始矩阵的稀疏问题,利用WKNKN(weight K nearest known neighbors)算法对原始关联矩阵进行处理以降低关联矩阵的稀疏性;第二步,为了科学地利用各种相似性信息,通过中心核对称多核学习(CKA-MKL)算法对多种相似性信息进行融合;第三步,采用压缩感知算法预测药物-疾病的潜在关联分数。为了验证DRPADC的性能,我们以药物-疾病数据集Fdataset和Cdataset作为金标准数据集进行验证。通过进行10次交叉验证,DRPADC同样在两个数据集上展现出良好的性能,AUC分别为0.941±0.001(Fdataset)和0.955±0.001(Cdataset),AUPR分别为0.521±0.001(Fdataset)和0.607±0.001(Cdataset)。此外,为测试DRPADC的实用性,我们在Fdataset和Cdataset中分别选取三种医用药物进行案例分析,并通过现有的公共数据库和一些研究文献加以验证。上述实验结果证实了我们方法的准确性和可靠性。(3)本文将BGMSDDA和DRPADC模型应用于预测SARS-Co V-2的潜在治疗药物。首先,将两模型在十次十折交叉验证框架下对人类药物-病毒关联数据库(Human drug-virus association database,HDVD)进行预测。然后根据预测结果计算对应的AUC和AUPR指标值,并与最新的一些模型进行对比。为了进一步验证两模型对HDVD的适用性,本文选取SARS-Co V-2作为案例进行案例分析。上述实验结果表明,BGMSDDA和DRPADC模型在药物重定位领域中表现出优秀的预测能力。
其他文献
因果关系的学习有助于我们理解数据背后的生成机制及回答“为什么”等问题,它被广泛应用在生物,医学,社会科学等领域。然而传统的因果关系学习方法大都是基于干预(interventions)或者随机实验(randomized experiments),这使得在现实应用中,往往需要较高的成本代价,或者是不道德的。如何仅从观测数据中挖掘背后的因果关系,也称因果结构学习,成为更加普适的研究方法。函数因果模型(F
学位
单光子发射计算机断层扫描(SPECT)是一种非侵入型的分子成像技术,在肿瘤和心血管成像等领域中发挥了重要作用。该技术在患者体外设有环绕旋转的探测单元,探测单元接收患者体内引入的放射性示踪剂衰变时所发射的高能光子,将光子在探测单元上的投影重建为对示踪剂分布的估计,利用不同组织间放射性活性的差异获取组织器官的生化信息。这些信息的变化往往早于宏观结构的改变,因此对某些疾病的早期发现和诊断具有优势。由发射
学位
路径规划(Path Planning)是智能机器人领域的重点研究方向之一,它与轨迹生成(Trajectory Generation)共同组成了运动规划的主要内容。其中,路径规划关注的是机器人在环境已知或未知的情况下,静态或者实时地规划出一条从起点到终点的无障碍碰撞路径。这类算法优劣的评判标准一般分为规划时间、路径长度两个方面,用更快的时间规划出一条最短路径是路径规划研究的主要目标。目前,静态环境下
学位
在大数据时代,知识图谱成为表示和组织海量知识的一种重要形式。其中,知识图谱的新探索领域是分布式知识表示学习,它主要研究在低维空间中如何表示知识图谱的关系与实体,同时捕捉其语义信息。但是,实体稀疏性常见于知识图谱,导致现有的分布式知识表示学习方法难以正确地学习到稀疏实体的向量表示,从而影响知识图谱的应用效果,为此,本文开展了以下工作:(1)提出一种捕获稀疏实体特征的激活机制,用于优化知识表示学习模型
学位
启发式搜索作为智能规划问题求解的重要范式之一,其性能主要取决于启发式估值函数的信息度和启发式搜索算法的效率。FF规划器的放宽规划图启发式、Fast-Downward规划器的因果图启发式、LAMA规划器的7)8)(8启发式等精心设计的领域无关启发式,都表现出了优异的求解性能。然而,不同的启发式具有不同的结构特征,代表了不同的设计策略。一方面,单一启发式并不能完美适用于所有规划问题。另一方面,预先设计
学位
掺铥光纤激光器(Thulium-Doped Fiber Laser,TDFL)输出功率的持续增长以及应用范围的不断拓展,其输出激光的功率稳定性要求也越来越严格。TDFL长时间工作时会因为光子暗化效应(Photon Darkening Effect,PD)的影响而导致输出功率慢慢下降,稳定性变差,温度升高等情况,严重影响了稀土掺杂激光器的持续发展。本论文以目前的光子暗化研究为基础,对掺铥光纤激光器的
学位
联合用药对复杂疾病的治疗具有非常重要的应用价值。通过药物组合治疗,可以提高临床治疗效果,减少药物的副作用,甚至可以帮助病人克服耐药性。近年来,联合疗法被研究人员应用到癌症治疗中,已经成为现代癌症治疗中不可或缺的一种治疗手段。在生物学中,研究人员凭借着先验的生物知识与临床经验,通过生物实验筛选方法来确定有效的药物组合。虽然传统的实验筛选方法已经有效地发现一批药物组合,但是随着大量新药被研发出来,药物
学位
与传统的协作过滤和基于内容的推荐不同,序列推荐通过对用户与项目之间顺序行为的建模,很好地捕捉到用户与项目之间的交互以及随时间变化的用户偏好。会话是对序列的更细粒度的划分,会话推荐可以更好地捕获用户的短期兴趣;图神经网络能对非欧式数据进行向量化表示,在推荐系统中,可以很好地捕获用户项目之间的关系,两者越来越受到业界广泛关注。在研读大量相关文献后,发现目前基于会话的序列推荐仍然存在以下问题:一是关注于
学位
序数回归(Ordinal Regression,OR)是指在具有有序类别数据的基础上建立分类模型。目前,序数回归模型得到了广泛的应用,但是现有的序数回归算法主要在单视角数据上建立分类器,面向多视角数据的序数回归算法还存在一定的空白。此外,由于采样误差、传输错误等原因,多视角数据可能存在不确定信息。如何利用有序数据中的多视角信息和处理有序数据中不确定信息,是本文亟待解决的问题。针对上述序数回归目前存
学位
三维目标检测是自动驾驶车辆环境感知的关键技术之一,通过提供周围场景中丰富的三维信息,为自动驾驶的下一步规划决策提供重要依据。鉴于单目相机价格便宜、容易安装等特点,基于单目的三维目标检测在商业应用中受到广泛青睐。为此,本文重点针对车辆、行人及非机动车检测,研究基于单目的轻量化三维目标检测算法,并实现了算法在移动端嵌入式设备SE5 AI平台的部署。主要研究内容如下:(1)单目三维目标检测基准算法测试。
学位