【摘 要】
:
近年来,随着生物医学实验方法的变革,生物医学方面的实验数据和文献资料呈指数级增长,如何从如此庞大的科学文献数据中快速有效地抽取有价值的信息,是当前亟待解决的问题。生物医学领域(如基因/蛋白质、化学物和疾病等)的实体识别与规范化是生物医学文本挖掘的基础,它对生物医学实体关系的抽取和生物医学知识库的建立等方面都有着重要的研究意义。其中,疾病名称识别与规范化是从生物医学文献资料中自动抽取疾病名称并且链接
论文部分内容阅读
近年来,随着生物医学实验方法的变革,生物医学方面的实验数据和文献资料呈指数级增长,如何从如此庞大的科学文献数据中快速有效地抽取有价值的信息,是当前亟待解决的问题。生物医学领域(如基因/蛋白质、化学物和疾病等)的实体识别与规范化是生物医学文本挖掘的基础,它对生物医学实体关系的抽取和生物医学知识库的建立等方面都有着重要的研究意义。其中,疾病名称识别与规范化是从生物医学文献资料中自动抽取疾病名称并且链接到指定疾病数据库中。针对这一任务,本文进行了以下三个方面的研究工作:(1)基于句法和语义特征的疾病名称识别。针对目前疾病名称识别中存在的问题,在条件随机场模型的基础上,提出了一系列新的句法特征和语义特征来获取疾病名称在句子中的结构信息以及在数据库中的语义信息。实验结果表明,本文的特征能够在疾病实体识别任务中取得较好的结果。(2)基于深度学习的疾病名称识别。为了缓解传统机器学习中特征稀疏性问题,本文采用了高性能的深度学习模型BiLSTM-CRF来实现疾病名称识别,探讨了不同的句法特征以及语义特征对疾病名称识别的影响。实验表明,深度学习模型获得了与当前最高性能相当的结果。(3)基于上下文信息的疾病名称规范化。将疾病名称规范化看做一个分类任务,首先针对疾病名称的特点,采用两种模糊匹配算法生成候选集,提高候选集的召回率;然后通过融入上下文信息的神经网络对候选集进行消歧。实验结果表明,本文采用的规范化方法在疾病领域取得了较好的性能。
其他文献
高职院校的人才培养模式必须紧跟当前时代发展的变化,尤其对高职会计专业来说,会计专业教师必须不断提升个人信息化教学能力,加强信息化教学模式的改革创新,完善信息化教学内
随着微电子技术的发展以及环保意识的增强,作为Pb/Sn焊料替代物的导电胶粘剂,已成为当前研究的热点和重点。介绍了导电胶粘剂的导电机理及其组成、功能和分类。重点概述了近
第一部分:一种前路兔腰椎间植骨融合模型的建立一、背景介绍自1911年Hibb S首次报道脊柱融合(Spinal fusion)手术100多年以来,该种手术方式已经发展成为脊柱外科一种重要的手
贝多芬的第九<合唱>交响曲和柴可夫斯基的第六<悲怆>交响曲是世界交响曲中登峰造极之作.文章力图从调性、曲式结构、主题旋律、创作背景等几个方面对这两部作品进行对比赏析,
职业诚信是指从业人员在工作岗位上遵循诚实守信的职业道德,诚实劳动、信守承诺、诚恳待人,善意行使权利和履行义务。职业诚信教育隶属于职业道德教育,是培养大学生诚实工作
电子政务是当前世界各国政府都在积极实施的一项战略措施,它对于提高政府工作效率、加强政府服务职能转变、实现“以人为本、执政为民”的行政理念,都有着重要意义。目前我国
随着互联网技术在医学领域的应用,大量具有丰富医学知识的电子病历随之产生。其中隐含着患者的诊断与症状、用药情况及治疗方式之间的潜在联系。对这些隐含知识进行分析与挖掘可以为临床辅助决策提供帮助,还可以为后续建立结构化的医疗领域知识图谱提供基础支持。然而,由于电子病历为医务人员所撰写的非结构化自由本文,其表述复杂,包含了大量医疗领域专业词汇,且在一定程度上受撰写者书写习惯影响。所以,对电子病历中包含的医
"互联网+教育"理念有望促进我国教育体制的重大改革,以慕课为代表的在线教育模式正成为高校教改的创新点。慕课教育模式在我国尚处于起步阶段,以著作权为主的知识产权相关争
在我国,对胎儿权利进行全面的法律保护仍然存在诸多空白。本文通过对民众的"胎儿生命权及损害赔偿请求权"观念的实证调查,结合国外有关胎儿权利保护的立法,建议我国法律应该承
在社会经济的迅速发展中,城市内的交通工具数量也在不断增加。在汽车中底盘属于关键部件,从汽车底盘构造入手,阐述了汽车底盘的日常维修技术,以保障汽车安全运行。