结合蛋白水平的多组学数据整合识别基因功能及致病基因

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:honest1988li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
致病基因预测一直是生物信息学领域的一个核心问题,发现致病基因是理解疾病发生机制、协助临床判断和预防治疗的基础。近年来产生了越来越多的基于功能相似性的致病基因预测方法,然而在目前定位的26000多个基因中,约有42%的基因的功能是未知的,功能注释的缺失会导致一些疾病候选基因在预测中被忽视掉。而如果仅仅在基因水平对基因功能进行预测是片面的,作为生物体内各种功能的主要执行者,蛋白质表达与基因功能息息相关,这就需要结合蛋白水平数据研究基因的功能。基于此,本文将结合人类蛋白质组表达数据并整合其他多组学数据预测人类未知基因的功能,预测致病基因。本文主要工作内容如下:本文提出了新的基因功能预测方法Pemo,其基于结合了蛋白质表达量的多组学数据预测基因功能。首先分析通过质谱实验得到的人类蛋白质表达量数据,构建未知功能基因的相关系数矩阵,利用相互作用网络筛选假阳性结果,根据组织特异性和条件概率构建先验概率功能矩阵,通过两个矩阵的乘积对功能注释进行打分排序。接着利用序列信息,RNA-Seq数据和互作网络数据分别对未知基因的功能进行预测,最后Pemo整合这四种组学数据对基因注释。在此基础上,本文结合蛋白水平信息和功能注释计算候选基因与遗传疾病之间的相关性。首先计算遗传疾病与Gene Ontology(GO)注释之间的关系,然后充分挖掘GO数据库功能注释之间的关系,综合考虑注释在GO结构中的距离和其父节点的交集,同时结合蛋白质表达量建立合理的评价机制,评估遗传疾病与基因的关系。在基因功能预测方面,本文首先比较了多种组学数据的预测结果,其中基于蛋白质表达数据集的方法在预测准确率上明显高于其他组学数据。然后分析了基于单一组学数据的预测和整合多组学数据的预测结果,证明Pemo整合多组学数据的策略是有效的,在结合了蛋白水平的信息后,预测准确率有了很大提高。比较Pemo方法和其他基因功能预测方法,在GO的三个方面Pemo的表现都是最好的。在致病基因预测方面,本文成功预测出胃癌、肺癌、乳腺癌和先天性心脏病等遗传疾病的致病基因,假阳性率也较低,在与其他致病基因预测方法进行比较时,本文方法的结果也是有优势的。在致病候选基因的相互作用网络图谱中,大多数致病基因参与共同的致病生物通路,其中一些参与程度较高的候选基因可能是潜在致病基因,有待今后实验进一步验证。
其他文献
电子智能机房是政府组织预算和社会通信等多个部门的数据心脏以及网络安全场所,其设计水平与施工情况关乎着组织部门的发展,因此电子智能机房设计工作和工程施工一定要从长远
观察雌激素对卵巢切除大鼠海马齿状回长时程增强的影响.采用电生理(长时程增强)指标探讨雌激素对卵巢切除大鼠海马齿状回长时程增强的影响.结果提示:卵巢切除后(3个月),大鼠
为了对组织层次上温室气体排放进行量化,为企业选择最有效的减排措施提供依据。该文以河北保定一规模化奶牛场为案例,利用气候变化框架公约(UNFCCC)清洁发展机制理事会批准的相
中国古代所谓“水银沁”铜镜, 表面白亮,反光性能良好,抗氧化腐蚀性能优良,历经千百年仍光可鉴人者不在少数。自铜镜被玻璃镜取代之后,这项延续2000多年的传统金属工艺即告失
期刊
中国走"一带一路"战略发展道路,加速了企业境外投资的进度,而且项目类型多,项目布局广泛。随着海外基建项目的增多布局节奏越来越快,融资上也需要面临各种挑战。本文的研究中
实施能源革命决策,必须调整能源消费结构。运用冗余分析法和排序图技术对中国1993年到2013年的能源消费结构与其影响因素进行了四个方面分析。研究结果:(1)选取的9个影响因素,GD
目的探讨DSA下联合超声在经皮经肝穿刺胆道恶性梗阻引流术(PTBD)中的应用价值。方法对32例恶性肿瘤所致的梗阻性黄疸(其中原发性肝癌4例,胆管癌21例,胆囊癌肝门转移2例,转移癌3
采用氧化还原法制备了纳米银粒子,在乙醇溶剂中,纳米银粒子表面成功包覆上了SiO2层。利用透射电镜、紫外可见吸收光谱、荧光光谱对纳米银及包覆结构(Ag为核,SiO2为壳,Ag@SiO2进行
在小学数学教学过程中,学生核心素养的培养方式包含了许多维度,如数感、符号意识、空间观念、几何直观、数据分析观念、运算能力、推理能力、数模思想、应用意识和创新意识等
继新东方年会后,又一家企业的年会也火了!不过走的却是另一种路子。$$近日,杭州电商公司有赞的年会上,高层突然宣布将实行新的“996上班制”。网传年会PPT图片显示,所谓“996上班
报纸