基于链路预测的长非编码RNA-疾病关联预测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ytxiaokang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的研究表明,长非编码RNA(long non-coding RNA,lncRNA)在许多生物过程中具有重要的功能。而这些长非编码RNA的变异或功能失调会导致一些复杂疾病的发生。目前关于长非编码RNA-疾病关联的研究和数据均较为匮乏,因此通过生物信息学方法预测潜在的长非编码RNA-疾病关联关系,是目前该领域研究的热点和趋势,这对于致病机理的探索以及疾病诊断、治疗、预后和预防都具有重要的意义。目前关于长非编码RNA-疾病关联的预测主要有基于计算模型的和基于复杂网络传播的方法。基于计算模型的方法或通过整合基因-疾病关联数据与长非编码RNA表达谱数据并利用超几何分布做富集分析,或引入高斯核函数计算相似性并构造拉普拉斯算子求最优解,这两种方法均存在模型复杂,参数个数多,复杂度高等问题。基于复杂网络传播的方法利用资源分配算法来计算长非编码RNA之间的相似性,再通过网络传播算法将相似性信息传播到整个网络中,这种方法需要计算矩阵的n次方或利用迭代算法做近似,计算复杂度高。局部结构性链路预测具有建模简单、复杂度低、准确性高等优点,并且满足相似疾病趋向由功能相同或相似的长非编码RNA引起的生物学假设,受其启发,本文将链路预测的思想引入到长非编码RNA-疾病关联预测中。但链路预测是基于依赖共同邻居的“三角形闭合”模型,并不能直接用在异质的二部网络上。针对该问题,本文提出了二部图上不同属性集的节点之间“共同邻居”的概念,并在此基础上建立二部图“四边形闭合”模型。利用“四边形闭合”模型改进了9个链路预测相似性指标使其适用于二部网络并将其运用到长非编码RNA-疾病关联预测中。在长非编码RNA-疾病关联二部网络上做留一交叉验证,AUC最高的BPA达到0.9377,比之前方法最高的0.7881提高了近19%。此外,在BPA指标中,有14条边在重构预测所有的19000多条预测边排名中均排名第一,有81条边在重构预测中排名所有预测边的前1%。对神经胶质瘤和肺癌的案例分析也显示了本文算法的强大预测能力。上述结果表明本文方法在长非编码RNA-疾病关联预测上具有很高的准确性,是对现有方法的很好提高和补充。此外,本文提供了一个新的思路去探索长非编码RNA-疾病关联预测问题,即基于局部结构性链路预测的角度,这对于简化问题模型和降低计算复杂度都有很大启发。
其他文献
随着计算机技术和Internet技术的迅速发展,企业的信息化管理需求越来越高,但是多数企业的各种不同信息系统以异构方式存在,形成了“信息孤岛”。当前各种数据交换技术运用于异构
随着计算机辅助教育研究的不断深入,计算机考试系统作为计算机辅助教学的重要组成部分越来越受到人们的关注。自动组卷是按照一定的要求,由计算机自动从试题库中选择试题,组成符
SAR图像分割是SAR图像理解和解译过程中的一个关键性工作,对后续的目标检测与识别等任务影响巨大。对于SAR图像的分割,传统方法往往需要借助经验提取人工设计的特征,这种特征
Web服务作为一种新兴的Web应用模式和分布式计算模型,从根本上解决了企业之间及企业内部异构系统之间的互操作和互通信问题。然而现有的主流Web服务发现方法是采用基于UDDI框
计算机网络的复杂性与日俱增,为实现网络安全智能化管理必须对网络进行有效的监测。本文通过利用现有的网络监测技术基于智能Agent中社会性的定义建立了一个可面向社会Agent设
随着新世纪的到来,高新技术发展和全球经济化的加速,我国的产业结构和就业结构正在发生重大变化,对人才的需求更加多样化,对人才培养的质量要求更高。高等职业教育作为高等教
随着多媒体技术和网络通信技术的飞速发展,视频已经广泛地用于政治、军事、商业、医疗和教育等行业。除了政治和军事这两个需要高保密性的领域外,其它领域对视频加密的需求也
由于无限传感器网络(WSNs)具有链路开放,节点生存周期有限,网络拓扑结构动态变化等特性,其安全性受到极大挑战。传统的防火墙机制在探测攻击行为方面具有很大的滞后性,而入侵
21世纪步入了信息时代,越来越多的科技产品引入了人脸识别技术。人脸识别可以帮助人们快速、精确的进行身份的识别,具有十分重要的研究价值和意义。本文对人脸识别的关键技术
随着信息技术的迅猛发展,社会对Web应用系统的需求日益增长。如何快速开发高质量的Web应用系统,以满足社会的需求,已成为当今软件开发领域中的热点问题。在现代Web应用系统开