基于BERT的手术名称标准化重排序算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：yuanjin123456

【摘要】

：

临床术语标准化是医学文本信息抽取中不可或缺的一项任务。临床上对于同一种诊断、手术、药品、检查、化验、症状等,往往会有多种不同的写法,术语标准化(归一)要解决的问题就

【作者】

：

陈漠沙仇伟谭传奇

【机构】

：

阿里巴巴机器智能技术实验室

【出处】

：

中文信息学报

【发表日期】

：

2021年3期

【关键词】

：

手术名称标准化 Lucene检索 BERT

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

临床术语标准化是医学文本信息抽取中不可或缺的一项任务。临床上对于同一种诊断、手术、药品、检查、化验、症状等,往往会有多种不同的写法,术语标准化(归一)要解决的问题就是为临床上各种不同的说法找到对应的标准名称。在检索技术生成候选答案的基础上,该文提出了基于BERT(bidirectional encoder representation from transformers)对候选答案进行重排序的方法。实验表明,该方法在CHIP2019手术名称标准化数据集上单模型准确率达到89.1%、融合模型准确率达到92.

其他文献

基于生成模型的闲聊机器人自动评价方法综述

近年来,随着人工智能技术的发展,更多数据被利用,数据驱动的端到端闲聊机器人技术得到快速发展,受到了学术界和工业界的广泛关注。但是对于闲聊机器人的评价,现在没有标准的

期刊

生成模型闲聊机器人自动评价方法

基于神经机器翻译编码器的语义学习分析

神经机器翻译凭借其良好性能成为目前机器翻译的主流方法,然而,神经机器翻译编码器能否学习到充分的语义信息一直是学术上亟待探讨的问题。为了探讨该问题,该文通过利用抽象

期刊

神经机器翻译编码器AMR

炼化污水处理厂节能降耗措施及效果

随着环保要求日益严格,以及炼化企业污水复杂多样,炼化污水处理厂运行成本大幅度增加,节能降耗成为诸多企业内部挖潜增效的有效途径.以某炼化污水处理厂运行为实例,在确保污

期刊

降本增效节能降耗炼化污水

客户来电意图识别研究

捕捉客户来电意图信息,开展客户来电意图识别研究具有重要意义。现有的客户来电意图识别大都是采用人工分析方法,尚没有采用机器学习、深度学习模型识别客户来电意图的研究。

期刊

意图识别机器学习深度学习BERT

基于信息增强BERT的关系分类

关系分类是自然语言处理领域中重要的语义处理任务,随着机器学习技术的发展,预训练模型BERT在多项自然语言处理任务中取得了大量研究成果,但在关系分类领域尚有待探索。该文

期刊

关系分类BERT自然语言处理神经网络

中国中文信息学会自然语言生成与智能写作专业委员会(筹)发起会议成功举办

中国中文信息学会自然语言生成与智能写作专业委员会(筹)发起会议于2021年3月30日在北京举行。学会名誉理事长李生教授,副理事长兼秘书长孙乐研究员,专委会筹委会主任赵铁军

期刊

基于ELMo和Transformer混合模型的情感分析

针对循环神经网络模型无法直接提取句子的双向语义特征,以及传统的词嵌入方法无法有效表示一词多义的问题,该文提出了基于ELMo和Transformer的混合模型用于情感分类。首先,该

期刊

情感分析ELMo模型Transformer模型多头自注意力机制自然语言处理

面向中文新闻文本分类的融合网络模型

针对神经网络文本分类模型随着层数的加深,在训练过程中发生梯度爆炸或消失以及学习到的词在文本中的语义信息不够全面的问题,该文提出了一种面向中文新闻文本分类的融合网络

期刊

文本分类密集连接双向门控循环神经网络最大池化自注意力机制

基于文本结构和图卷积网络的生成式摘要

目前主流的生成式自动文摘采用基于编码器—解码器架构的机器学习模型,且通常使用基于循环神经网络的编码器。该编码器主要学习文本的序列化信息,对文本的结构化信息学习能力

期刊

生成式文摘文本结构图卷积神经网络

CHIP2019评测任务1概述:临床术语标准化任务

第五届中国健康信息处理会议(China Conference on Health Information Processing, CHIP2019)组织了中文临床医疗信息处理方面的三个评测任务,其中任务1为临床术语标准化任

期刊

中国健康信息处理会议临床术语标准化自然语言处理

基于BERT的手术名称标准化重排序算法

与本文相关的学术论文