基于图属性嵌入的miRNA与疾病关联关系预测研究

来源 :西京学院 | 被引量 : 0次 | 上传用户:girl_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNA(miRNA)是一种内源性、微型、非编码RNA。它在细胞的生长、繁殖、分化、凋亡等生物过程中起着多种调节作用,并参与了许多复杂疾病的异常表达,从而使免疫系统缺失。因此,鉴定miRNA可以帮助研究多种复杂疾病,并借此来认识病理机制和发病机制,推动生物临床医学向前发展。全方面的探究miRNA-疾病潜在的关联关系也为生命科学的研究奠定了坚实的基础。近年来,研究者们已经成功发现了miRNA一部分的关联关系,但仍有很多的关系未被发掘。传统机器学习方法大多数只能研究它们之间浅层的关系,不能准确的预测miRNA-疾病潜在的关联关系,且实验室方法受实验周期长、环境设备要求高、价格昂贵等限制,很难在实验室以外的环境进行。因此,本文旨在研究miRNA与疾病之间关系做了以下工作:(1)收集miRNA和疾病的关联关系数据集。根据miRNA和疾病两个数据集的描述方式,使用医学主题词(Me SH)、MISIM数值计算方法分别计算疾病语义相似性和miRNA的功能相似性,并构建相似性网络,最后利用所提出的三个不同的方法CFM1、CFM2、CFM3得到三个数值化的特征矩阵。(2)针对miRNA与疾病网络嵌入学习中没有结合属性特征的问题,本文提出了将角色嵌入(Role2vec)方法与深度神经网络(Deep Neural Networks,DNN)相结合的预测模型,学习并提取miRNA-疾病的潜在关系特征。基于角色嵌入方法,通过把特征向量映射到角色空间中,学习每个节点的嵌入,然后把经过数值化表示的特征矩阵输入深度神经网络中训练,最后采用五折交叉验证的方法防止数据过拟合。为了进一步突出本文提出的预测模型的高效性,将所提出的角色嵌入-深度神经网络模型分别与不同类型特征提取方法(HOPE、LINE、SDNE)、不同分类器(SVM)作对比。实验结果表明,本文所提出的模型具有更好的预测性能。(3)针对miRNA与疾病在图属性嵌入学习中无法使滤波器保持低通特性以及滤波器与权重影响实验性能的问题。本文提出了将离散小波变换(Discrete Wavelet Transform,DWT)方法与自编码器(Autoencoder,AE)相结合的预测模型,学习并提取miRNA-疾病的潜在关系特征。基于离散小波变换的方法,把特征向量进行高\低通滤波,得到高\低频成分,学习低频中更多的特征信息,然后把经过数值化表示的特征矩阵输入自编码器中训练,最后还原原始数据。为了进一步突出本文提出的预测模型的优越性,将所提出的离散小波变换-自编码器模型分别与不同特征提取方法(FFT、HHT)、不同特征矩阵处理方法(CFM1、CFM2、CFM3)以及不同参数作对比。实验结果表明,本文所提出的模型性能更优。在以后的工作中,希望本文工作能成为基因组学研究的一种有效补充手段。
其他文献
药物不良反应(Adverse Drug Reaction,ADR)是指用药期间出现危害人体健康的有害反应。ADR提取方法旨在从文本中检测并提取ADR信息,对确保公众健康和防止医疗事故的发生具有重要意义。然而,大量ADR信息主要隐藏于非结构化文本中,具有关键词不连续、文本语义复杂特点,对ADR提取方法造成一定干扰。为此,本文围绕ADR分类与ADR提取实体展开研究,并针对上述难点提出对应的解决方法以更
学位
随着移动机器人产业的深入发展,移动机器人承担的任务越来越多样化,所遇到的环境也越来越复杂,如何在复杂的环境中实现移动机器人精准的定位与正确的建图是移动机器人实现自主移动执行任务的前提。当前仅靠单一传感器获取的信息无法满足移动机器人不同环境下的工作需求。为了解决这个问题,本文主要研究关于如何使用多源信息融合帮助移动机器人实现在不同环境中稳定的定位与建图功能进行研究。主要包括以下几个部分:(1)通过各
学位
随着微电子和微机电系统(MEMS,Micro-Electro-Mechanical System)的改进,机器人结构和应用创新发展迅猛,无人机作为技术发展的受益平台之一,也逐渐趋于小型化和智能化。人工操纵的无人机视野范围小,容易由于不可预知因素对人或物造成危险与伤害,因此为无人机提供自主导航功能是必要的。现有基于GNSS的无人机自主导航方案功能单一,单个无人机功耗高,有效载荷低,信息采集和处理智能
学位
无人机最早应用于军事领域,后凭借其体积小、重量轻、成本低等优点,广泛应用于民用领域。甚至在近年爆发的俄乌冲突中,民用无人机被大量投入战场,在巷战、爆破及侦查中发挥至关重要的作用。随着无人机应用范围增大以及“黑飞”现象日益严重,政府一方面要通过社会媒体、公共平台提高安全规范使用无人机的宣传力度,增强人们对无人机的安全和法制观念,创造一个遵纪守法使用无人机的社会环境,另一方面也迫切需要在技术上加强对违
学位
药物与药物相互作用是药物开发、临床应用和有效干预并促进生命过程的重要考虑因素。准确识别药物相互作用不仅可以避免许多用药医疗事故,还能推动药物基因组学、药物代谢组学、药物转录组学和药物蛋白质组学发展。然而传统的生物技术实验非常昂贵且相对耗时。因此迫切需要利用大规模数据计算预测方法作为决策辅助手段,预先筛选出高置信度的候选药物来缓解上述问题。本文针对如何有效地利用计算机技术与机器学习技术来预测潜在药物
学位
随着科学技术的发展,人们的社会生产和生活活动大部分在室内进行,对室内位置服务的需求日益迫切。由于信号遮蔽或衰减,现有的卫星导航定位系统难以在室内环境提供可靠的定位信息,因而,高精度的室内导航定位技术近年来备受关注,成为室内各种位置服务应用的关键。惯性测量不受时间、地点和环境影响,在室内环境可实现定位和导航,已成为室内定位的研究热点之一,但惯性测量存在着积分累积误差和航向漂移误差等问题,极大影响着室
学位
互联网时代的到来,国内的网民数量与日俱增,网络在给人们带来极大便利的同时,也出现了信息过载导致人们无法快速有效查阅到所需的资料,推荐系统便成为有效解决信息过载问题的方法之一。IT行业的迅速崛起,致使越来越多的人愿意从事计算机行业,同时行业内工作人员需要不断的学习新的技术知识来应对IT技术的快速更新迭代,面对这种需求,技术文章推荐平台应运而生。可当下国内主流的推荐平台仍存在诸多问题,给用户的针对性推
学位
大规模发展风能和太阳能发电是实现电力行业低碳转型和国家“双碳”目标的重要战略举措,但波动性可再生能源的大量接入会给电力系统运行的稳定性和安全性带来巨大挑战,系统的灵活运行能力是波动性可再生能源并网的重要决定因素。为了提高系统对风电和太阳能发电的消纳能力和质量,本文以“双碳”目标为背景,以波动性可再生能源整合为主线,围绕电力系统结构演化和灵活性资源作用方式,探讨了电力系统灵活性整合波动性可再生能源的
学位
随着军事技术的发展,数据链的地位越来越重要,在战争中起到连接作战平台、分发战术信息、调配作战资源、提高联合作战能力的作用。Link16是最具代表性的一种通用型联合战术数据链,具有信息共享、统一态势的功能,其采用TDMA方式组成网络,时间同步是网络实现各种功能的重要前提。研究Link16网络同步技术对我分多址数据链系统开发和应用具有重要意义。本文将Link16数据链同步技术作为研究对象,分析了Lin
学位
于2011年6月至2012年5月对浙江省湖州市老虎潭水库浮游植物进行了周年的生态学调查。调查期间共鉴定浮游植物7门60属96种,其中绿藻门46种,硅藻门21种,蓝藻门16种,甲藻门4种,隐藻门、裸藻门、黄藻门各3种,种类组成以绿藻门为主。浮游植物优势类群的季节演替明显,春季优势种呈现硅藻-蓝藻型,主要为短小曲壳藻(Achnanthes exigua);夏季则为硅藻型,主要优势种为尖针杆藻(Syne
期刊