【摘 要】
:
中医临床病历是中医重要的科研数据资源,但目前临床病历仍以文本为主要表达形式,对病历数据深入分析的前提是进行结构化信息抽取,而命名实体抽取是其基础性步骤。针对中医临
【机 构】
:
北京交通大学计算机与信息技术学院,北京交通大学交通数据分析与挖掘北京市重点实验室,中国中医科学院广安门医院
【基金项目】
:
国家自然科学基金资助项目(61105055,81230086);国家“863”计划基金资助项目(2012AA02A609);中央高校基本科研业务费专项基金资助项目(K13JB00140)
论文部分内容阅读
中医临床病历是中医重要的科研数据资源,但目前临床病历仍以文本为主要表达形式,对病历数据深入分析的前提是进行结构化信息抽取,而命名实体抽取是其基础性步骤。针对中医临床病历的命名实体,如症状、疾病和诱因等的抽取问题,通过手工标注的413份病历数据(以中文字为特征)与4类特征模版,将条件随机场(CRF)、隐马尔科夫模型(HMM)和最大熵马尔科夫模型(MEMM)用于中医病历命名实体抽取的实验,并进行比较分析。结果表明,结合合适的特征模版,CRF命名实体抽取方法取得了较好的性能,F1值的症状达到0.80,疾病名称达
其他文献
在搜索引擎竞价排名广告市场上,不仅存在着具有不同把关依据的多元把关人形态,而且在互动运作中形成独特的复杂把关模式。进而,这便促使传统把关人理论的调适:把关人不是一元
文章通过构建测算要素价格扭曲系数的理论框架,将经济增长率分解为要素价格扭曲、劳动增长、劳动报酬增长和技术进步偏向,利用1978-2013年中国31个省份的数据进行了测算分析
目的在非水相中利用酶法合成脑靶向脂质材料胆固醇-癸二酸-葡萄糖酯[(5-cholesten-3β-yl)(D-glucopyranose-6)sebacate,CHS-SE-GLU],并对其修饰的载紫杉醇脂质体制备处方及