生物实体关系挖掘与网络分析及MRDB数据库构建

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:wuyiguogdut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物医学领域,萃取生物学关系的方法主要集中在几种有限的关系类型上,而不是多实体间的关系,如基因、疾病、药物、复合物、代谢物、酶和解剖学词汇等。这些方法挖掘得到的关系缺少实体的注释信息。本文提出了一个新的基于关系模式从医学文献中萃取多实体间关系的方法。   本文用自动模式扩展方法,从180,000个摘要中萃取了172个普遍的关系模式,每个模式都包含两个生物学实体,注释信息以及一个关系动词。当应用这些关系模式萃取生物学关系时,可以得到92.5%的正确率,81.8%的覆盖率和86.8%的F-score。鉴于这样良好的结果,本文萃取了包含基因、疾病、药物、酶,代谢物、复合物和解剖学词汇之间的生物学关系,并构建了医学关系数据库(MRDB)进行存储。最后,本文综合分析了所挖掘得到的基因-疾病-药物之间生物学关系,发现与特定疾病相关的基因在基因-基因网络中更倾向于紧密连接。与特定基因相关疾病或药物在疾病-疾病网和药物-药物网络中也有同样的趋势。   综上所述,每个普遍的模式都能匹配多种类型实体间的关系。注释的信息能够使挖掘得到的实体更加可读和完整。因此,本文提出的方法比已有的实体关系挖掘方法更加适合表示多类型实体间的关系。通过分析多实体混合网络,本文发现与某实体相连的其它实体更加倾向于紧密连接。因此,混合生物网络中实体间的连通性可以作为实体关联预测的新测度。
其他文献
铸坯质量跟踪与判定系统可以在连铸生产中,对铸坯质量及时做出在线预报,对确保生产的连续性、提高产品质量及降低生产成本都具有极其重要的意义。世界上的著名钢铁企业对此都
自从1981年Iwahara等发现掺杂Y的钙钛矿型氧化物SrCeO3具有质子导电性以来,钙钛矿型固体电解质已经用于氢传感器、燃料电池、氢泵等多种电化学装置中。钙钛矿型固体电解质中C
传统Hall-Heroult铝电解槽由于采用消耗式炭素阳极而存在能耗高、炭耗大、成本高和环境污染严重等问题。因惰性阳极能够克服以上问题而成为铝业界的研究重点和热点。镍铁尖晶
我们使用HapMap计划中的基因型数据来研究人类基因区域的连锁不平衡模式。在确定单体型块在基因中的分布和结构后,我们分析了11个群体间11,998个基因区域的连锁不平衡模式。结
冠脉FFRCT是基于患者冠脉CT图像,利用计算流体力学方法获得狭窄冠脉血流储备分数(fractional flow reserve,FFR)的新的无创测量手段,近年来得到了临床医生和研究学者的广泛关注。F
腹膜透析液是含有渗透剂、缓冲碱和电解质的无菌溶液,是实现血液净化、纠正机体内环境紊乱的关键要素.研究发现透析液灌注腹腔后具有改善微循环、减轻水肿、调节淋巴回流、抑
钒氧化还原液流电池是近年来开发出的一种新型储能电池,因其对环境友好、电解液无交叉污染、能够深度放电而且不会损坏电池等诸多优点得到了迅速发展。但目前钒电池在电极材料方面还存在很多问题,制约着钒电池的发展。现阶段电极材料主要有:金属电极,复合导电塑料电极和碳素电极。碳素类电极中的石墨毡是一种具有良好导电性的多孔材料,具有耐腐蚀、表面积大、成本低等优点,是钒电池的首选电极材料。近年来,为了提高石墨毡电极
阿里巴巴电子商务早期想做B2B,不想B2B没什么起色,C2C却异军突起。其C2C虽然是在模仿eBay的基础上发展起来的,但与e Bay发展成为了全球最大的个人网上跳蚤市场不同,淘宝则成
环境变化可使生态系统中的物种多样性发生改变,进而影响物种间相互作用.同样,慢性肾脏病(CKD)可引起肠道菌群变化,并影响宿主健康.肾衰竭及其相关饮食和药物的变化,改变了肠
肾脏替代治疗(RRT)是急慢性肾功能损害患者重要治疗手段,在RRT下患者的残余肾功能(RRF)是影响患者预后的重要因素,而RRF的评估由于受RRT的影响存在一定困难,寻找新型指标显得