基于相似度网络的miRNA和疾病关联类型预测方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:liyn000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNAs(MiRNAs)是一类微小的内源性非编码RNA。近年来,许多研究表明miRNA的突变和调控异常会导致许多疾病,miRNA可以在疾病的诊断和治疗等过程中充当重要的生物标记物。早期,研究者们主要通过生物实验方法挖掘疾病和miRNA之间的调控关系,该类方法可以获得准确度较高的疾病相关联miRNA,然而存在设备昂贵、周期长的弊端。因此,研究可以预测miRNA-疾病关联关系的计算方法成为生物信息学领域的一个研究热点,该类方法对于挖掘miRNA和疾病之间的调控关系至关重要。本文综合利用多种生物学数据构建高质量的相似度网络,提出了两种针对miRNA-疾病关联类型预测问题的计算模型,分别为基于标签传播的miRNA-疾病关联类型预测算法NLPMMDA和基于张量分解的miRNA-疾病关联类型预测算法STDMMDA。两种算法都使用了多种数据计算疾病相似度和miRNA相似度,NLPMMDA算法使用该相似度信息构建异质网络,基于异质网络中节点的交互信息,利用少量已标记数据的标签值,使用基于相似度网络的标签传播算法预测大量未标记数据的标签值,实现miRNA-疾病关联类型的预测;STDMMDA算法使用该相似度信息和协同过滤思想更新三维关联类型张量,得到每种关联类型下miRNA-疾病的关联分数,之后使用张量分解模型对数据进行填补,同时挖掘三维张量中的隐性关系,实现miRNA-疾病关联类型的预测。本文提出的两种算法融合了疾病和miRNA的相似度信息,可以更好的挖掘数据间的潜在信息。另外,NLPMMDA模型使用了半监督学习算法,可以在没有负样本的情况下进行预测,STDMMDA算法使用张量分解模型对数据进行填补,避免负样本带来的误差,并且可以将算法适用范围扩大到孤立疾病。通过使用留一交叉验证进行评估,NLPMMDA算法和STDMMDA算法的平均AUC值分别为0.9739和0.8628,均高于已有最先进算法0.8606的效果,案例分析的结果进一步验证了两种算法预测结果的高可信度。
其他文献
高中历史教科书是根据高中课程标准的要求,依据高中学生的身心发展特点,为满足学生的学业成长需要而编写的体现历史学科内容的教学著作。青少年通过对历史教科书的学习,不仅可以丰富历史知识,还可以培养正确的历史观、人生观、世界观,学会用历史思维看待人类社会的发展历程。新中国成立以来,高中历史教科书的编写工作历经最初选优借用,到一纲一本,再到一纲多本,最后到部编本教科书的整个发展过程。其中,人民教育出版社一直
学位
随着经济全球化不断发展,中外企业合作交往日益频繁,翻译工作愈发成为中外企业合作的重要一环。而合同作为项目合作中双方权利与义务划分的正式法律文件,合同翻译更是起着至
研究目的:动作发展是贯穿个体整个生命周期的复杂过程,是人能动的适应环境和社会与之相互作用的结果。学龄前期是幼儿动作发展和情绪发展的关键时期,早期对幼儿大肌肉动作技
背景及目的:痛觉信息和触觉信息在人脑躯体感觉系统中通过丘脑和初级躯体感觉皮层(the primary somatosensory cortex,S1)、次级躯体感觉皮层(the secondary somatosensory cortex,S2)之间的双向传递通路(即前馈通路和反馈通路)进行处理。然而,在这一躯体感觉系统脑网络中,痛觉和触觉信息处理的层级结构是否存在差异,目前尚不清楚。对于该脑网络
随着社会的快速发展和全球化趋势,许多人开始关注第二语言并且学习第二语言。但是,目前许多汉语语言研究的对象集中于汉语学习策略或学习者的偏误分析,对于汉语作为第二语言学习过程中语言环境方面的研究还略显不足。成年人学习第二语言的过程与学习母语的过程有着根本的区别,由于学习者已经确立了母语语言体系,母语语言体系对第二语言学习的影响不可避免。因此,成人学习者受到的限制较多。此外,影响学习第二语言的因素较多,
目的早期胃癌(early gastric cancer,EGC)是指局限于粘膜层(T1a)或粘膜下层(T1b)的肿瘤。目前有限的研究探讨粘膜内癌(T1a EGC)和粘膜下癌(T1b EGC)的临床病理特征和预后。因此,本研究旨在探讨两组患者在淋巴结转移(lymph node metastasis,LNM)和预后方面的差异,以及确定影响LNM和预后的危险因素,为EGC的最佳治疗和术后随访提供依据。方
顾客对质量的要求伴随着社会的进步、经济和技术的快速发展而不断提升,使得质量的概念也伴随着时代的发展而不断的深化和演变,质量所涉及的范围和对象越加的丰富和广阔,质量
水环境中过量锑(Sb)所引起的环境污染受到越来越多关注。生物吸附除锑具有成本低、环境友好、吸附后重金属易回收等优点,近年来涌现出一系列关于生物吸附剂的研究报道,但这些生物吸附剂存在吸附容量低的缺陷,且铁盐改性杆菌吸附除锑的研究未见报道。因此,本研究围绕课题组前期从锑污染土壤中筛选获得的卡氏变形杆菌(Proteus cibarius DSHN0704)的氧化性及差异基因表达、优化培育及铁盐改性生物吸
炸药爆炸所产生的高温、高压气体在爆破介质破裂瞬间冲入大气,迅猛压缩邻近空气,形成空气冲击波。空气冲击波会对周围目标物产生不同程度作用与影响,甚至是破坏和损伤。井巷与隧道爆破作业时,由于受到限制空间的影响,爆破空气冲击波持续时间增长、峰值压力衰减变缓,对作业空间内人员与设备安全构成极大威胁。因此,针对限制空间条件下的爆破空气冲击波传播特性开展研究,并基于传播规律确定人员、设备的安全区域与安全距离,制
通过使用调和分析中的常用估计方法---Sharp极大估计法,对两类奇异积分算子与Campanato函数构成的交换子分别进行加权估计。各章具体安排如下:第一章:叙述了Campanato函数与