基于异质网络的基因相似性搜索方法的研究与设计

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:jinn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序技术的发展,基因数据呈现出迅猛增长的趋势,在这种情况下,通过生物学实验方法发现相似基因效率比较低,而基于异质网络结构研究基因相似性搜索算法已经成为生物信息学研究的热点。在基因-疾病-表型形成的异质网中,挖掘疾病、表型间潜在的关联信息、合理量化节点间链接权重对基于pathSim算法探究基因相似性起到了至关重要的作用。然而,现有研究在基于pathSim算法探究基因相似性时很少考虑以上两个因素,导致链接稀疏性问题,使得基因相似性计算结果的准确率比较低。为解决以上不足,本文提出一种改进的加权元路径基因相似性搜索算法gSim-Search。本文的研究内容包括:(1)针对目前研究存在对疾病、表型自身潜在的关联信息考虑不够全面的问题,本文从语义关联和拓扑关联两个方面去研究疾病、表型的自身相关性。对于疾病、表型的语义关联计算,采用一种语义贡献图的方法,在疾病、表型各自形成的有向无环图中,分别通过计算不同疾病或者表型祖先节点对某一具体疾病或者表型的最大语义贡献值来衡量疾病、表型的语义关联性。对于疾病、表型的拓扑关联计算,分别基于基因-疾病网络、疾病-表型网络,采用高斯核相似性进行疾病与疾病、表型与表型相似性的计算。然后,将语义关联矩阵和拓扑相似性矩阵进行融合获得疾病和表型各自的关联矩阵。(2)针对基因-疾病-表型异质网中链路稀疏并且没有合理量化链路关联程度的问题,本文采用二部图算法探究链路之间的关联程度。首先,将融合后的疾病、表型的关联网络通过构建资源扩散矩阵的方式融入基因-疾病-表型异质网中。然后,基于资源扩散矩阵,采用二部图的方法实现资源的非均等扩散,为了保证原有的基因-疾病、疾病-表型的拓扑关联关系不被破坏,本文在不削弱已有链接关联程度的情况下,合理量化潜在链接的关联程度。(3)通过以上工作,构建了一个蕴含丰富生物信息的加权异质网络,在此基础上,利用pathSim算法基于路径实例权重计算基因的相似性。为了验证gSim-Search算法的有效性,本文选择直接邻居法作为算法评价标准。通过对比实验证明,本文算法在乳腺癌和肥胖症两种基因相似度计算和排名时大幅度提高了预测致病基因相似性的准确率。比如,在top20排名时,乳腺癌致病基因相似性的准确率提高了10%,肥胖症致病基因的准确率提高了20%。并且,在预测致病基因相似性的准确率方面,本文算法计算结果普遍高于其他算法的计算结果,充分验证了算法的有效性。
其他文献
网络在人们的社会生活中不断普及,它不但能够为人们提供更多的沟通平台,使人们能够发挥自己的话语权,还能使人们充分发挥自己所拥有的媒介权力,即“第五种权力”,其被称为网
微电网作为一个相对独立运行的电网结构,是未来分布式可再生能源参与电能交易的主要市场。在微电网中,分布式电源(Distributed Generation,DG)的渗透率不断提高,导致了电力供
神经祖细胞(Neural Progenitor Cell,NPCs)是中枢神经系统(Central Nervous System,CNS)中一种特殊类型的专能干细胞,具有自我更新和定向分化为星型胶质细胞(Astrocyte,Ast),少突胶质细胞(Oligodendrocyte,OL)和神经元(Neuron,Neo)的能力。NPCs不仅作为哺乳动物CNS发育早期的神经发生细胞,在成熟的CNS中,N
AADL(Architecture Analysis and Design Language)是一种用于描述复杂嵌入式系统体系架构的建模语言国际标准,被广泛用于安全关键系统的建模与验证。AADL通过系统、子系统、
文本分类是许多自然语言处理应用中的一项基本任务。面对互联网上呈爆炸式增加的文本资源,如何利用文本分类技术,合理高效地对这些资源进行管理以及分类,挖掘其中潜在的商业
实域是指-1不能表示成平方和的域。实闭域是指没有真的实代数扩域的实域。实数域与实代数数域是实域和实闭域的主要例子。本文用R表示实闭域。实域和域的主要区别在于是否存
在中国古代文学叙事体式的发展过程中,诗与文相结合的形式是一种常见的、重要的叙事模式,这种体式在小说文体中的表现更为明显。作为早期文言小说作品的魏晋南北朝志怪小说,
胡克最初是菲律宾共产党在抗日期间组织成立的抗日武装,二战后胡克为了要求农业改革和反抗政府的暴力镇压,发展成为反政府的胡克运动。胡克运动迅速发展的背后反映了菲律宾严
在化学生产以及生物制药过程中,随着化学反应的不断进行,晶体的形貌会发生不断变化,为获取理想的产物,需要对晶体结晶过程进行监控,获取晶体在反应过程中的各种生长信息以控
信息时代,摄影作为一种记录媒介,已经逐渐成为人类观看方式的延伸并渗透进了我们的日常生活。摄影术诞生至今短短的一百多年间,我们的社会已经积累了无数的照片。从传统摄影