医学表型实体的同义关系分析和概念规范化研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zhangyinalv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学知识图谱构建是医学人工智能研究的重要问题,是临床诊疗决策支持系统研发的重要支撑,其中表型实体及其关系是医学知识图谱的重要组成部分。然而由于医学术语库的动态变化和医学文本的快速累积,医学知识图谱中表型实体及其关系的维护和更新耗时耗力。因此,自动预测医学术语库间的表型概念同义关系,并建立医学文本中表型术语提及与规范化概念的映射关系是医学知识图谱构建的基础性研究工作。针对以上问题,本文的主要研究工作如下:首先,本文针对不同术语库的表型同义关系分析问题,构建了基于排序学习的分析方法。该方法将表型同义关系预测问题转化为对候选表型术语排序的问题,利用PubMed文献及相关信息,生成表型术语网络嵌入表示。然后通过相似度计算和排序学习的排序方法预测不同表型术语的同义关系。其次,研制了基于分类学习的术语同义关系分析方法。该方法将表型同义关系预测问题转化为对表型关系分类的问题,基于表型术语的网络嵌入表示构建表型术语关系的特征向量,分别使用支持向量机、逻辑回归、多层感知机、朴素高斯贝叶斯和随机森林等分类模型进行表型术语关系分类,然后基于融合分类模型对表型关系分类,进而预测表型之间的同义关系。本文在表型术语同义关系数据集上分别进行了基于排序学习和基于分类学习方法的同义关系预测实验。结果表明,两种方法在表型同义关系分析问题上均有较好的表现,其中基于分类的方法F1最高可达0.942。最后,针对表型概念规范化问题,本文将该问题分解为表型命名实体识别和表型实体链接两个子任务。首先,分别利用卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)学习字符向量和词向量,并结合条件随机场(CRF)构建BiLSTM-CNN-CRF模型,实现表型命名实体识别。然后基于CNN排序模型实现表型实体链接。并在National Center for Biotechnology Information(NCBI)疾病语料库和BioCreative V Chemical Disease Relation(BC5CDR)疾病语料库上进行对比实验,验证了方法的有效性。
其他文献
<正>目的研究显示氧化应激与tau蛋白病包括阿尔茨海默病(AD)的发病机制相关。番茄红素(lyc)作为强抗氧化剂能够减缓机体的氧化损伤。本文旨在探讨番茄红素对P301L转基因小鼠
会议
异常子宫出血是妇科常见的临床症状,是引起妇女缺铁性贫血的主要原因,严重影响妇女的身心健康.50%子宫切除与此有关.近几十年来各种子宫内膜消融技术已逐渐成为子宫切除的一
本文介绍了电子地图的实现及测试.系统对所查询的交通路线与乘车方案等用电子地图的形式给予显示.可以更换不同城市的地图,通用性强;能对各种信息进行维护.并结合传统的测试
"做中学、做中教"课程模式强调的是一个"做"字,即在操作过程中完成"教"与"学"。教学过程中,学生一方面掌握了相关的操作技能,另一方面也掌握了相关的理论知识,真正做到了理论与实践一
磁共振(Magnetic Resonance,MR)成像是当今医学领域的一种非常重要的成像方法,MR特殊图像成像方法导致其成像在复杂度、难度以及成像速度上都远高于其他常见的成像方法,成像
针对内网办公中机密数据需要安全和高速加解密的特点,本文提出了基于组合对称密钥的机密数据存储和传输方案。其中组合对称密钥的加密方法与以往对称加密相比,具有加密密钥一
变电站电力变压器贮油池的大小与电力变压器油的油量有着直接关系,并与变压器的外形尺寸有直接关联。根据多年的设计实践经验和相关规程要求,对主变贮油池体积进行系统分析,
细胞因子是机体的各种细胞合成和分泌的小分子多肽类物质,多为糖蛋白.它们调节机体的生理功能,参与各种细胞的增殖、分化和行使功能.细胞因子包括[1]:白细胞介素(IL);集落刺
期刊