BioTrHMM:基于迁移学习的生物医学命名实体识别算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:julia_203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的生物医学命名实体识别方法需要大量目标领域的标注数据,但是标注数据代价高昂。为了降低生物医学文本中命名实体识别对目标领域标注数据的需求,将生物医学文本中的命名实体识别问题化为基于迁移学习的隐马尔可夫模型问题。对要进行命名实体识别的目标领域数据集无须进行大量数据标注,通过迁移学习的方法实现对目标领域的识别分类。以相关领域数据为辅助数据集,利用数据引力的方法评估辅助数据集的样本在目标领域学习中的贡献程度,在辅助数据集和目标领域数据集上计算权值进行迁移学习。基于权值学习模型,构建基于迁移学习的隐马尔可夫模型算法BioTrHMM。在GENIA语料库的数据集上的实验表明,BioTrHMM算法比传统的隐马尔可夫模型算法具有更好的性能;仅需要少量的目标领域标注数据,即可具有较好的命名实体识别性能。
其他文献
诱惑侦查的犯罪是在本来没有犯罪发生的情况下,由侦查机关“协助”实现的犯罪,在这里,立法者理性建构的从现实中抽象出来的“类型”化犯罪论体系与诱惑侦查下的这种“类型”外的
为深入贯彻党中央、国务院关于生态文明建设的决策部署,落实《国务院办公厅关于转发国家发展改革委住房城乡建设部生活垃圾分类制度实施方案的通知》精神,加快推进全省城镇生活
报纸
本文以上海银行间同业拆放利率(Shibor)为基准利率,建立了一个含家庭、企业家、零售商、商业银行和中央银行的动态随机一般均衡(DSGE)模型,并对该模型的经济预测能力和经济分
司机在倒车时主要借助反光镜和后玻璃窗来观察车后障碍物,但总有死角存在,长车身车辆倒车更是不便。介绍一种基本单片机控制的超声波倒车测距仪,能解决以上问题,成本低、体积
保险区划对于森林保险的实践具有十分重要的意义,但是我国有关森林保险区划的工作进展缓慢。本研究选取浙江省永嘉、丽水莲都、青田、缙云四县(区)为案例研究区,以森林火灾为
作为长期反映非营利组织中涉税业务的专门化会计,高校税务会计实践和客观存在,对其进行探索性的梳理和总结,可为高校税务会计理论建立,奠定一定基础。
<正> “老师管学生,学生被老师管”这一单向的管理结构是否科学?中学教师怎样才能从多头、繁杂的学生事务中解放出来?学校的教育怎样才能使学生入耳入脑,收到较好的效果?这些
<正>2012-06-08,在江苏省交通运输厅和南京市科学技术委员会组织召开的成果鉴定会上,由江苏省交通科学研究院和南京重大路桥建设指挥部、东南大学、中交第二公路工程局有限公
目的探讨老年性尿路感染(UTI)患者血清降钙素原水平的变化及其临床意义。方法回顾性分析确诊老年性尿路感染患者72例的临床资料,通过测定血清中降钙素原(PCT)的浓度,并与白细
气象业务服务已成为社会经济发展中一项重要的关系国计民生的行业服务。目前,山西省气象综合探测系统建设日趋完善,各种类型的气象观测技术不断改进,气象观测的要素越来越多,数据