基于随机游走和卷积神经网络的miRNA-疾病关联预测研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:djseagle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识别与疾病相关的microRNA(miRNA)有助于我们了解疾病的病因以及发病机理。研究发现miRNA是通过调控靶基因(mRNA)的表达,进而行使其生物学功能。然而,经生物实验验证的靶基因数量较少。因此,很多基于靶基因来预测疾病相关的miRNA方法很难达到理想的预测效果。目前,大多数预测与疾病相关的miRNA的方法都基于这样一个生物前提,miRNA功能越相似其所关联的疾病就越相似,反之亦然。这些方法利用miRNA和疾病相关信息构建miRNA-疾病双层异构网络,通过整合网络中多种信息来预测疾病潜在关联的miRNA。但是这些方法在计算miRNA相似性过程中,并没有考虑miRNA家族信息对相似性的影响。因为源于同一个家族的miRNA通常协同参与到疾病的发生发展过程中,所以,将家族信息融入miRNA相似性计算中是很有必要的。此外这些预测方法都是基于浅层模型提出的,很难挖掘出miRNA与疾病之间隐含的、复杂的、非线性的深层特征。这将在一定程度上影响这些方法预测性能的提升。针对以上提及的不足,我们提出了两类预测方法:第一类,基于有重启的随机游走关联预测方法,第二类,基于双路卷积神经网络的关联预测方法。基于有重启的随机游走关联预测方法:根据疾病的语义和表型信息计算疾病相似性,构建疾病网络。功能相似的miRNA往往参与调控相似的疾病,反之亦然。根据miRNA关联的疾病以及家族信息计算miRNA功能相似性,构建miRNA网络。根据miRNA和疾病的关联信息,构建miRNA-疾病关联网络。通过整合这3个网络得到miRNA-疾病双层异构网络,我们在此基础上提出了一种基于有重启的随机游走预测方法。我们将网络中已知的miRNA-疾病关联节点称为‘有标记节点’,目前尚未确认的miRNA-疾病关联称为‘未标记节点’,并对这两类节点构建概率转移矩阵。我们为不同类型的节点分配不同的转移概率权重。此外,我们通过重启概率来控制游走者的游走范围,这样有助于减少噪声数据对实验结果的影响。在预测过程中,基于有重启的随机游走方法充分利用了miRNA相似性、已知的miRNA-疾病关联、疾病相似性以及异构网络的拓扑信息,同时,我们还考虑了不同网络层信息的重要性。我们的方法在15个人类疾病的ROC-AUC以及PR-AUC指标上取得了优异的效果,此外,乳腺癌、结直肠癌以及肺癌的案例分析结果进一步佐证了该方法发现疾病潜在关联miRNA的能力。基于双路卷积神经网络的关联预测方法:传统关联预测方法都是基于miRNA和疾病初始特征信息(相似性和关联特征)提出的,并没有对miRNA和疾病的初始特征信息进行表征学习进而挖掘出初始信息中隐含的非线性数据特征。鉴于基于浅层模型的预测方法很难充分挖掘miRNA和疾病特征中蕴涵的非线性关系,我们提出了一种深度学习的预测框架,基于双路卷积神经网络的关联预测方法。该方法不仅整合了miRNA和疾病的初始特征信息,还捕获了miRNA和疾病网络的拓扑特征。通过结合miRNA和疾病的生物学前提,我们根据初始特征以及网络拓扑特征构建了特征嵌入层,通过卷积神经网络对特征嵌入层的数据信息进行深度特征表示。该预测框架分为左右两个模块,左侧模块侧重于miRNA和疾病的初始特征信息,并对这些特征信息进行表征学习获取更加深层次的特征表示。右侧模块侧重于miRNA和疾病的网络拓扑信息,并通过预测框架进行特征表示,学习拓扑信息中隐含的非线性关系。最后,按照一定的策略将左右两个模块的预测结果结合在一起得到miRNA-疾病关联评分。该方法同时与其它4类方法进行了比较,在ROC-AUC、PR-AUC以及前k个候选结果的召回率等评估指标上都远优于其它方法,此外,乳腺癌、结直肠癌以及肺癌的案例分析结果进一步验证了该方法的预测性能。
其他文献
利用柞蚕卵繁育赤眼蜂防治农林害虫的效果显著。随着对赤眼蜂需求的增大,以及技术的普及推广,对柞蚕卵的需求量也随之增大,而近几年柞蚕灰卵病的出现严重影响了繁蜂的产量及质量。本研究首先对引起柞蚕灰卵病的致病菌进行了鉴定,并以松毛虫赤眼蜂为供试寄生蜂,柞蚕灰卵和健康卵为中间寄主,通过比较两种寄主卵对松毛虫赤眼蜂寿命、繁殖力、寄主选择与适应性、子代蜂个体大小与抱卵量、子代蜂寄生能力等方面的差异,明确了在生产
亚洲玉米螟是东北玉米主产区发生最重、危害最大的害虫之一,利用赤眼蜂,如松毛虫赤眼蜂,玉米螟赤眼蜂等对其进行防治的手段已经较为普遍。根据田间的实际释放与回收蜂种的情况来看,田间寄生的玉米螟卵孵育出的大多数为玉米螟赤眼蜂,而松毛虫赤眼蜂的回收率偏低,这一现象的出现导致大家对松毛虫赤眼蜂防治亚洲玉米螟的效果产生质疑。寄生蜂之间的种内或种间竞争是一种普遍现象,这种竞争会影响对优势蜂种的正确评价,进而对防治
目的:考察脊髓水平5-HT2AR-PKC-GlyT2通路在切口痛大鼠痛觉敏化中的作用。方法:本实验均采用成年SD雄性大鼠进行疼痛行为学测定和分子生物学实验取材。首先,我们参考预实验结
InP基高电子迁移率晶体管(HEMT)具有高频率、高增益、低功耗和低噪声等优异特性,在高速卫星通讯、高精度深空探测等空间设备电子系统中具有巨大的应用潜力。在空间辐射环境中质
研究目的:当前老年人身体活动水平与医疗支出横断面数据的量化关系证据往往一致性不强。本文对混杂因素进一步控制,包括只纳入与身体活动相关性较强的慢性非传染性疾病药物费
由“5G+AI+lo T+4K”等高科技技术所构成的智媒体时代的到来,将赋能内容经济迸发出强劲的增长动力和业态活力。在未来,智媒体矩阵将对包括知识付费在内的多个内容经济细分领域进行深层次的变革,对构成内容经济业态的四大主体——内容平台、内容生产者、商业化服务者、内容消费者,的行为逻辑进行颠覆。在此宏观背景下,知识付费平台除了关注产品维度的发展和平台服务能力维度的发展,更重要的是在整个市场范围内打造
移动机器人作为机器人领域的重要组成部分,其理论和应用研究一直是研究热点课题并受到广泛关注。与工业机器人所处的结构化环境不同,移动机器人的应用环境具有复杂性、动态性
目的:通过观察血清YKL-40、GDF-15、OPG水平与SYNTAX积分之间的关联性,探讨血清YKL-40、GDF-15、OPG对于冠状动脉病变的临床意义,以便更好地指导临床医师。方法:选取2016-08—2018-08到承德医学院第二临床学院就诊并接受冠状动脉造影术检查确诊为冠心病患者172例,依据造影结果统计SYNTAX积分,然后依照统计结果分为低危组(SYNTAX积分≤22)和高危组(SY
植物在自然界中往往会受到多种植食性昆虫为害,当植物受到这种为害时自身会产生诱导防御反应并能对取食害虫起到直接和间接、有利或不利的影响。本文在国内外现有的研究基础上并结合课题组前期所积累的工作基础上,选择茶蚜、茶尺蠖幼虫为研究对象,利用昆虫生物学测定和分子生物学等研究方法,测定茶蚜蜜露对茶尺蠖的生长发育和取食选择的影响;茶蚜成虫为害不同天数的茶树叶片提取物饲喂茶尺蠖对茶尺蠖幼虫的生长发育影响;测定茶
随着我国高速铁路网络建设逐步从“四纵四横”迈向“八纵八横”,如今高速铁路已成为旅客出行主要选择的运输方式之一,高速铁路的发展和完善大大加剧了客运市场的竞争。在此背景下,城际旅客列车既有的票额分配方式已不再适应市场的变化和竞争。铁路客票分配调整工作目前是相关工作人员根据自身主观经验估计客流需求变化基础上进行的,由于主观经验难以对需求变化有较为准确的估计,导致客运需求和列车席位数量不匹配的现象时有发生