基于组织特异网络模型的疾病基因排序方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:renrenxiaonei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
疾病基因的预测和发现有助于理解疾病的产生机理,对疾病的诊断和医治十分重要。传统的生物实验手段检测疾病基因费用高昂、耗时耗力且技术难度较高。因此,利用生物信息学方法对疾病基因进行预测,已成为预测疾病基因的重要方式。所谓疾病基因排序问题,就是指以疾病基因与疾病的关联程度为度量,对潜在的疾病基因进行排序,以衡量其可能致病或参与某个疾病过程的可能性,从而在生物实验中有针对性的进行验证。目前人们已经提出了各种类型的疾病基因排序方法,基于网络模型进行疾病基因排序是其中十分重要的一种,且其结果表明这是一类准确率较高的疾病基因排序方法。基于网络模型进行疾病基因排序的主要思想是,首先以某种方式构建网络,然后将已知疾病基因的信息映射到网络中,最后根据网络中候选基因与已知疾病基因的某种距离或相似性度量来对候选基因进行打分和排序。目前基于网络策略的方法多数都是基于以下假设,即所有疾病都与同一个分子间相互作用网络相关联。然而,很多疾病都趋向于在特定的组织中产生,且不同的组织其相关的分子间相互作用网络是不同的。本文使用一种新的网络模型进行疾病基因排序,这里的网络模型基于以下思想:对不同的疾病,不使用同一个分子间相互作用网络,而是针对每种疾病,确定与其关联性最强的组织,然后针对这种疾病使用相应的组织特异分子间相互作用网络,再进行后续的随机游走步骤。本文的随机游走方法使用了一种考虑网络间关系的度量指标衡量候选基因与已知疾病基因之间的距离。在网络上进行随机游走得到疾病基因排序结果,首先对方法的效率和参数进行分析,发现随机游走方法效率较高,可以在10次迭代以内收敛。其次将本文方法与PRINCE方法和BlockRank方法的比较,通过交叉验证说明了本文方法对疾病基因排序的准确性高于其他方法;然后在全局蛋白质相互作用网络上使用同样的随机游走方法,通过对结果进行交叉验证,发现使用组织特异性蛋白质相互作用网络对疾病基因排序的准确性有所提升,肌萎缩性脊髓硬化症对应的AUC值可以由0.758提升至0.876,甲状腺激素抵抗综合症对应的AUC值可以由0.788提升至0.852;最后以胰腺癌为例对实验结果进行文献验证,发现排序前10名的基因中有6个基因被文献证实与胰腺癌存在关联,可以认为本文工作对疾病基因排序与预测的结果较为可靠。
其他文献
当前,我国正处于经济社会发展的转型阶段,农村人口流动更加频繁、社会结构更加多元、组织形式更加多样、利益关系更加复杂,面对新形势新任务,为解决新矛盾新问题,党的十九大首次提出了实施乡村振兴战略的决策部署,这是党和国家对未来一个时期农村工作的重要部署,影响深远、意义重大。村级组织作为直面群众的最基层组织,既是各级政府联系农村的重要桥梁和纽带,又是落实上级政策、维护社会稳定的重要组织,对我国实现乡村振兴
心血管疾病是威胁人类健康的主要疾病之一。近些年,随着人们生活节奏的加快和工作压力的加大,越来越多的人不幸患有甚至死于心血管疾病。由于心血管疾病具有发病突然、死亡率
目的:探讨鬼针草水煎液对高脂高糖诱导的小鼠非酒精性脂肪肝的防治作用及可能的作用机制。方法:100只Balb/c小鼠适应性喂养1w后,随机选取其中80只小鼠,用高脂高糖饲料喂养8w,建立非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)动物模型,其余的20小鼠用常规动物饲料喂养;对NAFLD模型动物进行血清学指标的测定和肝脏组织结构及病理结构分析,然后将
一般本体理论认为本体是“共享概念模型的明确的形式化规范说明,它确定了领域内共同认可的词汇和词汇之间的相互关系。”但随着时间的推移,这些概念和概念之间的关系会发生变
细胞表面展示技术是指通过锚定蛋白与外源蛋白融合表达,借助锚定蛋白可结合到细胞外膜的特性将外源蛋白携带到细胞的表面,一方面克服了因为细胞膜的阻隔而造成底物和酶蛋白无
近年来问答对话系统不断受到热捧,问答对话系统主要分为基于特定任务的对话系统和开放域的对话系统。随着技术的不断提升,以及对话场景的丰富性,在特定的场景中,通过与机器对话的方式来解决用户问题的任务型对话系统备受关注。本文研究的对话系统基于金融机构的业务催收场景来构造一个系统主导的问答对话平台。随着深度学习在自然语言处理中的不断发展,目前深度学习已经逐渐被引入到问答对话系统中来,主要研究方向包括针对问答
栓皮栎(Quercus variaabilis BI.)是我国重要的鞣料资源植物,其包被果实的壳斗(即橡碗)单宁含量很高,是非常重要的栲胶生产原料。栓皮栎树皮、叶片、枝条等不同器官,也含有一
近些年来,作为工程建设领域新兴管理模式和对建筑业产生深远影响的装配式建筑,是建设行业为提升行业生产效率、在理论研究和工程实践基础上发展起来的变革性建造管理模式。但我国装配式建筑发展仍面临着很多风险,政策法规不健全、市场培育不成熟、产业链不完善、施工技术难度大等问题的普遍存在,限制了装配式建筑的发展。因此,对配装式建筑全生命周期的风险进行全面识别并且控制,对促进配装式建筑快速发展、节约能源、降低成本
随着大数据时代的到来,政务数据量也越来越大,政府部门之间数据资源采集存在着数据规范不统一、数据格式不相同、数据类型不一致等问题,此外政务数据相关的部门众多,这些问题
栓皮栎(Quercus variabilis)是我国暖温带落叶阔叶林和亚热带常绿落叶阔叶混交林的重要建群种,在我国华北、华中、华南、西南22个省区均有分布(N22°-42°;E99°-122°,海拔5