论文部分内容阅读
为了提供规范的资源属性、概念取值和关联类型描述,文章以间质性疾病领域为实验对象,构建了包含元数据元素集和取值词汇集在内的领域关联词汇集。首先,借鉴领域已有的词表、类表和规范文档等,创建了通用关联词汇集;其次,采用N-gram统计分词、命名实体识别、模式识别等多种技术方法,构建了领域核心关联词汇集,以更好地引出和关联该主题领域的各种资源与数据。