基于网络嵌入的miRNA-靶基因关联预测算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:xbh88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNA作为人类体内最重要的小分子之一,通过多种方式调控靶基因的表达,与许多复杂疾病相关。新一代测序技术的发展以及海量的生物医学数据的积累,对理解miRNA在生物网络中的调控机制和复杂疾病的发病机理提供了便利。生物信息学算法的提出大大加快了miRNA-靶基因的关系预测的进度,然而现有的方法在有效利用已知数据提取特征方面还有待改进,因此本文以miRNA和靶基因为研究对象,利用miRNA和靶基因的多源数据,结合网络嵌入和深度学习的计算方法,设计出能够预测潜在的miRNA-靶基因相互作用的算法模型,加快生物实验的进程。主要工作如下:(1)鉴于现有的miRNA-靶基因预测方法存在未高效利用已知数据,选取特征忽略了数据之间关系信息等不足。本文结合邻居信息和网络嵌入的方式,设计了miRNA-靶基因关联预测算法Multi-MTI(Multi Information MiRNA-Target Interaction)。该方法一方面从网络关联信息出发,构建融合邻居信息的miRNA-靶基因二分网络,利用网络表示学习方法Deepwalk学习miRNA和靶基因之间的关系特征。另一方面从序列信息出发,利用Role2vec方法学习miRNA和靶基因的序列特征。对所学数据特征和关系特征进行拼接,并利用一个注意力网络来预测miRNA和靶基因的关系。通过五折交叉验证,Multi-MTI与其他对比方法相比,在多项评估指标中皆获得了更好的效果。消融实验和参数分析表明了Multi-MTI模型的每一环节都对结果带来更好的作用。通过对未知样本预测结果的案例分析,进一步展示了Multi-MTI具有预测潜在miRNA-靶基因关联的能力。(2)为了进一步探索网络中节点对之间的关系特征,提出了算法MDCNN(Metapath-based Deep Convolutional Neural Network)。一方面,以元路径的形式出发,将网络节点对的关系联系在一起,提高算法的可解释性。另一方面,针对所学的特征的有效性对于miRNA-靶基因起着重要的作用,设计成一个端到端的框架,可以在训练的过程中更新参数,自适应地学习到最佳的特征表示。五折交叉验证表明,MDCNN与Multi-MTI和其他对比方法相比较,在各项评估指标都获得了更高的值。消融实验表明,利用多源信息能够使模型捕获更多的节点信息。参数敏感性分析过程表明,参数对模型的影响较小,具有很强的鲁棒性。最后通过对hsa-mir-26b-5p和CDKN1A的案例研究,说明了MDCNN具有预测新的潜在的miRNA靶基因关联的能力。
其他文献
随着半导体的迅猛发展,如何提升微处理器运行速度是大规模集成电路的主要研究方向。直接内存访问DMA(Direct Memory Access)便是一种主流的解决方案。它具有独立访问主系统内存的优势,在CPU执行其它工作时,DMA可以进行存储器和外围设备之间的数据搬移,极大的减轻了CPU的工作负担,提高了整个系统的性能。DMA对于微处理器的重要作用使得DMA的功能验证显得尤为重要。验证方法学UVM(U
氯苯酚具有急性毒性、耐生物降解性和强生物累积性,研究表明其对人类的健康有严重危害。所以,人们十分关注氯苯酚类污染物的处理,亟需开发用于安全处理氯苯酚类污染物的技术。催化加氢脱氯法是一种极具前景的环境中含氯有机污染物修复技术,因为它反应条件温和、无二次污染、产物可回收利用且能够用于处理多种含氯有机污染物。然而,由于催化剂的低催化活性及稳定性,以及使用氢气作为氢源的潜在安全性问题,阻碍了催化加氢脱氯技
在人们长时间居住的建筑物内,室内环境质量对室内人员的身心健康至关重要。通常认为室内环境质量的四个主要影响因素为:热环境、光环境、声环境和室内空气质量。以往的研究详细分析了单一环境因素对人体环境感知的影响,但人体感知受到多种环境因素的综合影响。目前,未有研究探讨光环境和室内空气质量的交互作用,且光照对热生理反应的影响会引起主观感知的变化,现有的研究很少结合生理参数来分析环境因素间的交互作用。因此,有
由于应力集中的影响,材料表面和内部的微缺陷更容易引起疲劳裂纹的萌生,进而最终导致疲劳断裂。在过去的几十年里,大量的研究学者针对微缺陷对传统金属材料疲劳失效的影响展开了广泛的研究。随着科学技术的不断发展,现代工业领域中涌现出一批新型的材料改性技术和制备技术,如表面纳米化处理和增材制造技术。然而,对于这类新兴技术所加工或制造出的材料,关于微缺陷对其疲劳失效机理的影响还有待研究。在实际的工程应用中,由于
图像分割是机器视觉中至关重要的处理过程。图像分割算法通常分为有监督和无监督两类。其中,有监督的分割算法需要利用标记样本进行训练学习,而无监督的分割算法可以直接对数据进行处理。模糊聚类算法(FCM)是经典的无监督分割算法,但该算法易受图像噪声和异常值的影响。因此,现有的FCM改进算法通过引入空间信息来增强FCM算法抵抗图像噪声和异常值的能力,尽管部分改进算法能达到理想的分割效果,但是其计算复杂度较高
由于量子尺寸效应和边缘效应,一维材料(1D)表现出许多与二维材料(2D)不同的性质。近年来,由一维材料和二维材料组成的混维异质结以其优异的电学和物理性能引起了人们的关注,它们不仅表现出二维纳米片的性质,还拥有一维材料的性质。然而,以往对2D/1D异质结的研究主要集中在垂直异质结上,对于2D/1D横向异质结的报道目前仍然很少。2D过渡金属二硫族化合物(TMDs)具有独特的依赖于层数的电学和光学特性,
甲烷(CH4)是一种重要的温室气体,而农田作为甲烷排放的主要来源之一备受关注。生物炭是一种多孔且富碳的固体材料,具有性质稳定、环境友好等特性,并且中国存在大量的农作物残茬和林业废弃物,为生物炭的制备提供了数量可观的原材料,向环境中添加生物炭是一种既能合理处置农林废弃物又可能有效减少甲烷排放的技术。此前已有研究表明生物炭的施用影响了稻田土壤的微生物群落和土壤理化性质等,但是关于不同来源生物炭如何影响
电线杆、路灯杆、交通信号灯杆、广告牌杆等杆状物遍布各处,随着国内城乡现代化建设的步伐逐渐加快,此类杆状物的数量及种类也大幅增加。为了确保这些杆式建筑能够正常使用,需要经常对其进行检测、清洗或维护等工作,此前大多是依靠人工攀爬去完成,有些还属于高空作业,存在一定的安全风险,且效率较低;若采用高空作业车,或搭建高架对杆件进行作业,又会使成本较高,缺少机动性。本课题拟研发一款专用于攀爬杆式建筑的机器人,
具备自修复性能的聚合物材料(自修复聚合物)可克服传统聚合物材料使用寿命短、工作环境苛刻等问题,成为二十一世纪备受关注的新型智能材料之一。根据其修复机理,自修复聚合物可分为两大类:引入其它化学物质进行聚合等反应实现修复的外援型自修复聚合物;利用聚合物自身的可逆共价键或非共价键作自修复位点实现修复的本征型自修复聚合物,其中本征型自修复聚合物在修复次数、制备流程、参数调节等方面优于外援型自修复聚合物。因
汽车的出现,促进了世界经济的发展,也对人们生活产生了巨大的影响,使人们的生活更加便利。但随着汽车保有量的持续增加,多种环境问题显现,汽车的排放问题和能源消耗问题急需世界各个企业解决。于是,许多企业开始推动传统汽车行业转型,结合电子信息技术,提出了汽车行业的“新四化”,使汽车行业向着电动化、网联化、智能化、共享化发展。论文基于这一发展背景,不同于传统以控制策略、能量管理的角度研究提高汽车续航(减少能