论文部分内容阅读
中文语言自身的特点决定了从中文自然语言文档中获取知识是非常困难的.尽管目前对中文的命名实档体识别(简称为NER)已经取得了较好的效果,但是如果不借助同义词表或者类似WordNet的中文语言知识库,几乎无法正确地抽取已经识别出的实体之间的关系.文章提出了一个基于本体主题的思想进行中文知识获取的方法,该方法首次将主题思想引入领域本体,由领域专家对原始的领域本体中的概念和属性按照主题进行划分,建立起概念到主题、主题到属性的关联关系.在对一句话进行知识抽取时,通过简单的NER和直接与本体映射的方法可以识别出一句话