论文部分内容阅读
目的探索电子病历后结构化命名实体识别率。方法抽取1000份运行电子病历,利用自然语言处理(NLP)技术进行语义识别。结果本次评测抽取了1000份入院记录,针对检查、临床表现、药品等8个实体类别进行分类抽取,抽取量较大,预计能取得较好的识别效果。结论基于深度学习的方法可以利用包括词法分析、句法分析、语义分析、文档分析更多的特征,帮助临床进行更好的数据抽取服务。但中文电子病历因有其独特的语言特性,医疗行业习惯用语大量出现,包含一些以数字和单位表示的检查结果和英文缩写词,句子语法结构不完整,模式化较强等,造成中